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CALCUL DES PROBABILITÉS 


INTRODUCTION ('). 


I. — Le hasard. 

« Comment oser parler des lois du hasard? Le hasard 
n’esl-il pas l’antithèse de toute loi? » Ainsi s’exprime Ber¬ 
trand, au début de son Calcul des probabilités. La probabi¬ 
lité est opposée à la certitude; c’est donc ce qu’on ignore 
et, par conséquent semble-t-il, ce qu’on ne saurait calculer.. 
Il y a là une contradiction au moins apparente et sur 
laquelle on a déjà beaucoup écrit. 

Et d’abord qu’est-ce que le hasard? Les anciens distin¬ 
guaient les phénomènes qui semblaient obéir à des lois 
harmonieuses, établies une fois pour toutes, et ceux qu’ils 
attribuaient au hasard; c’étaient ceux qu’on ne pouvait pré¬ 
voir parce qu’ils étaient rebelles à toute loi. Dans chaque 
domaine, les lois précises ne décidaient pas de tout, elles 
traçaient seulement les limites entre lesquelles il était per¬ 
mis au hasard de se mouvoir. Dans celte conception, le mot 
hasard avait un sens précis, objectif : ce qui était hasard 


( 1 ) Cette Introduction est extraite du Chapitre intitulé : Le hasard, 
dans mon Ouvrage Science et Méthode (Flammarion). 
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pour l’un, était aussi hasard pour l’autre et même pour les 
dieux. 

Mais cette conception n’est plus la nôtre; nous sommes 
devenus des déterministes absolus, et ceux mêmes qui 
veulent réserver les droits du libre arbitre humain laissent 
du moins le déterminisme régner sans partage dans le 
monde inorganique. Tout phénomène, si minime qu’il soit, 
a une cause, et un esprit infiniment puissant, infiniment 
bien informé des lois de la nature, aurait pu le prévoir dès 
le commencement des siècles. Si un pareil esprit existait, 
on ne pourrait jouer avec lui à aucun jeu de hasard, on per¬ 
drait toujours. 

Pour lui, en effet, le mot de hasard n’aurait pas de sens, ou 
plutôt il n’y aurait pas de htisard. C’est à cause de notre fai¬ 
blesse et de notre ignorance qu’il y en aurait un pour nous. 
Et, même sans sortir de notre faible humanité, ce qui est 
hasard pour l’ignorant, n’est plus hasard pour le savant. Le 
hasard n’est que la mesure de notre ignorance. Les phéno¬ 
mènes fortuits sont, par définition, ceux dont nous ignorons 
les lois. 

Mais cette définition est-elle bien satisfaisante? Quand les 
premiers bergers chaldéens suivaient des yeux les mouve¬ 
ments des astres, ils ne connaissaient pas encore les lois de 
l’Astronomie; auraient-ils songé à dire que les astres se 
meuvent au hasard? Si un physicien moderne étudie un phé¬ 
nomène nouveau, et s’il en découvre la loi le mardi, aurait- 
il dit le lundi que ce phénomène était fortuit? Mais il y a 
plus : n’invoque-t-on pas souvent, pour prédire'un phéno¬ 
mène, ce que Bertrand appelle les lois du hasard? Et, par 
exemple, dans la théorie cinétique des gaz, on retrouve les 
lois connues de Mariotte et de Gay-Lussac, grâce à celte 
hypothèse que les vitesses des molécules gazeuses varient 
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irrégulièrement, c’est-à-dire au hasard. Les lois observables 
seraientbeaucoup moins simples, diront tous les physiciens, 
si les vitesses étaient réglées par quelque loi élémentaire 
simple, si les molécules étaient, comme on dit, organisées, 
si elles obéissaient à quelque discipline. C’est grâce au 
hasard, c’est-à-dire grâce à notre ignorance, que nous pou¬ 
vons conclure; et alors si le mot hasard est tout simplement 
un synonyme d’ignorance, qu’est-ce que cela veut dire? Faut- 
il donc traduire comme il suit? 

« Vous me demandez de vous prédire les phénomènes 
qui vont se produire. Si, par malheur, jeconnaissais les lois 
de ces phénomènes, je ne pourrais y arriver que par des 
calculs inextricables et je devrais renoncer à vous répondre; 
mais, comme j’ai la chance de les ignorer, je vais vous 
répondre tout de suite. Et, ce qu’il y a de plus extraordi¬ 
naire, c’est que ma réponse sera juste. » 

Il faut donc bien que le hasard soit autre chose que le 
nom que nous donnons à notre ignorance, que parmi les 
phénomènes dont nous ignorons les causes, nous devions 
distinguer les phénomènes fortuils, sur lesquels le calcul 
des probabilités nous renseignera provisoirement, et ceux 
qui ne sont pas fortuits et sur lesquels nous ne pouvons 
rien dire, tant que nous n’aurons pas déterminé les lois qui 
les régissent. Et pour les phénomènes fortuits eux-mêmes, 
il est clair que les renseignements que nous fournit le cal¬ 
cul des probabilités ne cesseront pas d’être vrais le jour où 
ces phénomènes seront mieux connus. 

Le directeur d’une compagnie d’assurances sur la vie 
ignore quand mourra chacun de ses assurés, mais il compte 
sur le calcul des probabilités et sur la loi des grands nom¬ 
bres et il ne se trompe pas, puisqu’il distribue des dividendes 
à ses actionnaires. Ces dividendes ne s’évanouiraient pas si 
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un médecin très perspicace et très indiscret venait, une fois 
les polices signées, renseigner le directeur sur les chances 
de vie des assurés. Ce médecin dissiperait l’ignorance du 
directeur, mais il n’aurait aucune influence sur les divi¬ 
dendes qui ne sont évidemment pas un produit de cette 
ignorance. 


II. — Définition du hasard. 

Pour trouver une meilleure définition du hasard, il nous 
faut examiner quelques-uns des faits qu’on s’accorde à 
regarder comme fortuits, et auxquels le calcul des probabi¬ 
lités paraît s’appliquer; nous rechercherons ensuite quels 
sont leurs caractères communs. 

Le premier exemple que nous allons choisir est celui de 
l’équilibre instable; si un cône repose sur sa pointe, nous 
savons bien qu’il va tomber, mais nous ne savons pas de 
quel côté; il nous semble que le hasard seul va en décider. 
Si le cône était parfaitement symétrique, si son axe était 
parfaitement vertical, s’il n’était soumis à aucune autre 
force que la pesanteur, il ne tomberait pas du tout. Mais le 
moindre défaut de symétrie va le faire pencher légèrement 
d’un côté ou de l’autre, et dès qu’il penchera, si peu que ce 
soit, il tombera tout à fait de ce côté. Si même la symétrie 
est parfaite, une trépidation très légère, un souffle d’air 
pourra le faire incliner de quelques secondes d’arc ; ce sera 
assez pour déterminer sa chute et même le sens de sa chute 
qui sera celui de l’inclinaison initiale. 

Une cause très petitë, qui nous échappe, détermine un 
effet considérable que nous ne pouvons pas ne pas voir, et 
alors nous disons que cet effet est dû. au hasard. Si nous con¬ 
naissions exactement les lois de la nature et la situation de 
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l’univers à l’instant initial, nous pourrions prédire exacte¬ 
ment la situation de ce même univers à un instant ultérieur. 
Mais, lors même que les lois naturelles n’auraient plus de 
secret pour nous, nous ne pourrious connaître la situation 
qu’ approximativement. Si cela nous permet de prévoir la 
situation ultérieure avec la même approximation, c’est tout 
ce qu’il nous faut, nous disons que le phénomène a été 
prévu, qu’il est régi par des lois; mais il n’en est pas tou¬ 
jours ainsi, il peut arriver que de petites différences dans les 
conditions initiales en engendrent de très grandes dans les 
phénomènes finaux; une petite erreur sur les premières 
produirait une erreur énorme sur les derniers. La prédic¬ 
tion devient impossible et nous avons le phénomène for¬ 
tuit. 

Notre second exemple sera fort analogue au premier et 
nous l’emprunterons à la météorologie. Pourquoi les mé¬ 
téorologistes ont-ils tant de peine à prédire le temps avec 
quelque certitude?Pourquoi les chutes de pluie, les tempêtes 
elles-mêmes nous semblent-elles arriver au hasard, de sorte, 
que bien des gens trouvent tout naturel de prier pour avoir 
la pluie ou le beau temps, alors qu’ils jugeraient ridicule de 
demander une éclipse par une prière? Nous voyons que les 
grandes perturbations se produisent généralement dans les 
régions où l’atmosphère est en équilibre instable. Les 
météorologistes voient bien que cet équilibre est instable, 
qu’un cyclone va naître quelque part; mais où, ils sonthors 
d’état de le dire; un dixième de degré en plus ou en moins 
en un point quelconque, le cyclone éclate ici et non pas là, 
et il étend ses ravages sur des contrées qu’il aurait épar¬ 
gnées. Si l’on avait connu ce dixième de degré, on aurait 
pu le savoir d’avance, mais les observations n’étaient ni 
assez serrées, ni assez précises, et c’est pour cela que tout 
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semble dû à l’intervention du hasard. Ici encore nous retrou¬ 
vons le même contraste entre une cause minime, inappré¬ 
ciable pour l’observateur, et des effets considérables, qui 
sont quelquefois d’épouvantables désastres. 

Passons à un autre exemple, la distribution des petites 
planètes sur le zodiaque. Leurs longitudes initiales ont pu 
être quelconques; mais leurs moyens mouvements étaient 
différents et elles circulent depuis si longtemps qu’on peut 
dire qu’actuellement, elles sont distribuées au hasard le 
long du zodiaque. De très petites différences initiales entre 
leurs distances au Soleil, ou ce qui revient au même entre 
leurs mouvements moyens, ont fini par donner d’énormes 
différences entre leurs longitudes actuelles; un excès d’un 
millième de seconde dans le moyen mouvement diurne 
donnera, en effet, une seconde en trois ans, un degré en dix 
mille ans, une circonférence entière en trois ou quatre 
millions d’années, et qu’est-ce que cela auprès du temps 
qui s’est écoulé depuis, que les petites planètes se sont déta¬ 
chées de la nébuleuse de Laplace? Voici donc une fois de 
plus une petite cause et un grand effet; ou mieux de petites 
différences dans la cause et de grandes différences dans 
l’effet. 

Le jeu de la roulette nous éloigne moins qu’il ne semble 
de l’exemple précédent. Supposons une aiguille qu’on peut 
faire tourner autour d’un pivot, sur un cadran divisé en 
ioo secteurs alternativement rouges et noirs. Si elle s’arrête 
sur un secteur rouge, la partie est gagnée, sinon, elle est 
perdue. Tout dépend évidemment de l’impulsion initiale 
que nous donnons à l’aiguille. L’aiguille fera, je suppose, 
10 ou 20 fois le tour, mais elle s’arrêtera plus ou moins vite, 
suivant que j’aurai poussé plus ou moins fort. Seulement, il 
suffit que l’impulsion varie d’un millième, ou d’un deux-mil- 
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lième, pour que mon aiguille s’arrête à un secteur qui est 
noir ou au secteur suivant qui est rouge. Ce sont là des 
différences que le sens musculaire ne peut apprécier et qui 
échapperaient même à des instruments plus délicats. Il 
m’est donc impossible de prévoir ce que va faire l’aiguille 
que je viens de lancer, et c’est pourquoi mon cœur bat et 
que j’attends tout du hasard. La différence dans la cause est 
imperceptible, et la différence dans l’effet est pour-moi 
de la plus haute importance, puisqu’il y va de toute ma 
mise. 


III 

Voici maintenant d’autres exemples où nous allons voir 
apparaître des caractères un peu différents. Prenons d’abord 
la théorie cinétique des gaz. Comment devons-nous nous 
représenter un récipient rempli de gaz? D’innombrables 
molécules, animées de grandes vitesses,.sillonnent ce réci¬ 
pient dans tous les sens; à chaque instant, elles choquent 
les parois, ou bien elles se choquent entre elles; et ces. 
chocs ont lieu dans les conditions les plus diverses. Ce qui 
nous frappe surtout ici, ce n’est pas la petitesse des causes, 
c’est leur complexité. Et, cependant, le premier élément se 
retrouve encore ici et joue un rôle important. Si une molé¬ 
cule était déviée vers la gauche ou la droite de sa trajec¬ 
toire, d’une quantité très petite, comparable au rayon d’ac¬ 
tion des molécules gazeuses, elle éviterait un choc, ou elle 
le subirait dans des conditions différentes, et cela ferait 
varier, peut-être de 90 0 ou de 180°, la direction de sa vitesse 
après le choc. 

Et ée n’est pas tout, il suffit, nous venons de le voir, de 
dévier la molécule avant le choc d’une quantité infiniment 
petite, pour qu’elle soit déviée, après le choc, d’une quan- 
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tité finie. Si alors la molécule subit deux chocs successifs, 
il suffira de la dévier, avant le premier choc, d’une quantité 
infiniment petite du second ordre, pour qu’elle le soit, après 
le premier choc, d’une quantité infiniment petite du pre¬ 
mier ordre et, après le second choc, d’une quantité finie. Et 
la molécule ne subira pas deux chocs seulement, elle en 
subira un très grand nombre par seconde. De sorte que si le 
premier choc a multiplié la déviation par un très grand 
nombre A, après n chocs, elle sera multipliée par A' 1 ; elle 
sera donc devenue très grande, non seulement parce que A 
est grand, c’est-à-dire parce que les petites causes pro¬ 
duisent de grands effets, mais parce que l’exposant n est 
grand, c’est-à-dire parce que les chocs sont très nombreux 
et que les causes sont très complexes. 

Passons à un deuxième exemple; pourquoi, dans une 
averse, les gouttes de pluie nous semblent elles distribuées 
au hasard? C’est encore à cause de la complexité des causes 
qui déterminent leur formation. "Des ions se sont répandus 
dans l’atmosphère, pendant longtemps ils ont été soumis à 
des courants d’air constamment changeants, ils ont été 
entraînés dans des tourbillons de très petites dimensions, 
de sorte que leur distribution finale n’a plus aucun rapport 
avec leur distribution initiale. Tout à coup, la température 
s’abaisse, la vapeur se condense et chacun de ces ions 
devient le centre d’une goutte de pluie. Pour savoir quelle 
sera la distribution de ces gouttes et combien il en tombera 
sur chaque pavé, il ne suffirait pas de connaître la situation 
initiale des ions, il faudrait supputer l’effet de mille cou¬ 
rants d’air minuscules et capricieux. 

Et c’est encore la même chose si l’on met des grains de 
poussière en suspension dans l’eau; le vase est sillonné par 
des courants dont nous ignorons la loi, nous savons seule- 
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ment qu’elle est très compliquée; au bout d’un certain 
temps, les grains seront distribués au hasard, c’est-à-dire 
uniformément, dans ce vase, et cela est dû précisément à 
la complication de ces courants. S’ils obéissaient à quelque 
loi simple, si, par exemple, le vase était de révolution et si 
les courants circulaient autour de l’axe du vase en décri¬ 
vant des cercles, il n’en serait plus de même, puisque 
chaque grain conserverait sa hauteur initiale et sa distance 
initiale à l’axe. 

On arriverait au même résultat en envisageant le mélange 
de deux liquides ou de deux poudres à grains Uns. Et pour 
prendre un exemple plus grossier, c’est aussi ce qui arrive 
quand on bat les cartes d’un jeu. A chaque coup, les cartes 
subissent une permutation (analogue à celles qu’on étudie 
dans la théorie des substitutions). Quelle est celle qui se 
réalisera? La probabilité, pour que ce soit telle permutation 
[par exemple, celle qui amène au rang n la.carte qui occu¬ 
pait le rang <p («) avant la permutation], cette probabilité, 
dis-je, dépend des habitudes du joueur. Mais si ce joueur 
bat les cartes assez longtemps, il y aura un grand nombre 
de permutations successives; et l’ordre final qui en résultera 
ne sera plus régi que par le hasard; je veux dire que tous 
les ordres possibles seront également probables. C’est au 
grand nombre des permutations successives, c’est-à-dire 
à la complexité du phénomène, que ce résultat est dû. 

Un mot enfin delà théorie des erreurs. C’est ici que les 
causes sont complexés et' qu’elles sont multiples. A combien 
de pièges n’est pas exposé l’observateur, même avec le 
meilleur instrument? Il doit s’attacher à apercevoir les plus 
gros et à les éviter. Ce sont ceux qui donnent naissance 
aux erreurs systématiques. Mais quand il les a éliminés, en 
admettant qu’il y parvienne, il en reste beaucoup de petits, 
P. 2 
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lesquels, en accumulant leurs effets, peuvent devenir dan¬ 
gereux. C’est de là que proviennent les erreurs acciden¬ 
telles; et nous les attribuons au hasard, parce que leurs 
causes sont trop compliquées et trop nombreuses. Ici 
encore, nous n’avons que de petites causes, mais chacune 
d’elles ne produirait qu’un petit effet; c’est par leur union 
et par leur nombre que leurs effets deviennent redou¬ 
tables. 


IV 

On peut se placer encore à un troisième point de vue, qui 
-a moins d’importance que les deux premiers et sur lequel 
j’insisterai moins. Quand on cherche à prévoir un fait et 
qu’on en examine les antécédents, on s’efforce de s’enqué¬ 
rir de la situation antérieure; mais on ne saurait le fairepour 
toutes les parties de l’univers, on se contente de savoir ce 
qüi se passe dans le voisinage du point où le fait doit se 
produire, ou ce qui paraît avoir quelque rapport avec ce 
fait. Une enquête ne peut être complète, et il faut savoir 
choisir. Mais il peut arriver que nous ayons laissé de côté 
des circonstances qui, au premier abord, semblaient com¬ 
plètement étrangères au fait prévu, auxquelles on n’aurait 
jamais songé à attribuer aucune influence et qui, cepen¬ 
dant, contre toute prévision, viennent à jouer un rôle 
important. 

Unhomme passe dans la rue enallantà ses affaires; quel¬ 
qu’un qui aurait été au courant de ces affaires pourrait dire 
pour quelle raison il est parti à telle heure, pourquoi il est 
passé par telle rue. Sur le toit travaille un couvretir; l’en¬ 
trepreneur qui l'emploie pourra, dans une certaine mesure, 
prévoir ce qu’il va faire. Mais l’homme ne pense guère au 
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couvreur, ni le couvreur à l'homme : ils semblent apparte¬ 
nir à deux mondes complètement étrangers l’un à l’autre. Et 
pourtant, le couvreur laisse tomber une tuile qui tue 
l’homme, et on n’hésitera pas à dire que c’est là un hasard. 

Notre faiblesse ne nous permet pas d’embrasser l’univers 
tout entier, et nous oblige à le découper en tranches. Nous 
cherchons à le faire aussi peu artificiellement que possible, 
et, néanmoins, il arrive, de temps en temps, que deux de ces 
tranches réagissent l’une sur l’autre. Les effets de cette 
action mutuelle nous paraissent alors dus au hasard. 

Est-ce là une troisième manière de concevoir le hasard ? 
Pas toujours; en effet, la plupart du temps, on est ramené à 
la première ou à la seconde. Toutes les fois que deux 
inondes, généralement étrangers l’un à l’autre, viennent 
ainsi à réagir l’un sur l’autre, les lois de cette réaction ne 
peuvent être que très complexes, et, d’autre part, il aurait 
suffi d’un très petit changement dans les conditions ini¬ 
tiales de ces deux mondes pour que la réaction n’eût pas 
lieu. Qu’il aurait fallu peu de chose pour que l’homme 
passât une seconde plus tard, ou que le couvreur laissât 
tomber sa tuile une seconde plus tôt I 

V. — Les lois du hasard. 

Tout ce que nous venons de dire ne nous explique pas 
encore pourquoi le hasard obéit à des lois. Suffit-il que les 
causes soient petites, ou qu’elles soient complexes, pour 
que nous puissions prévoir, sinon quels en sont les effets 
dans chaque cas, mais au moins ce que seront ces effets en 
moyenne? Pour répondre à cette question, le mieux est de 
reprendre quelques-uns des exemples cités plus haut. 

Je commencerai par celui de la roulette. J’ai dit que le 
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point où s’arrêtera l’aiguille va dépendre de l’impulsion ini¬ 
tiale qui lui est donnée. Quelle est la probabilité pour que 
celte impulsion ait telle ou telle valeur? Je n’en sais 
rien, mais il m’est difficile de ne pas admettre que celte 
probabilité est représentée par une fonction analytique con¬ 
tinue. La probabilité pour que l’impulsion soit comprise 
entre «eta + s sera alors sensiblement égale à la probabi¬ 
lité pour qu’elle soit comprise entre a -h s et a -h 2 s, pourvu 
que s soit très petit. C’est là une propriété commune à toutes 
les fonctions analytiques. Les petites variations de la fonc¬ 
tion sont proportionnelles aux petites variations de la 
variable. 

Mais, nous l’avons supposé, une très petite variation de 
l’impulsion suffit pour changer la couleur du secteur devant 
lequel l’aiguille finira par s’arrêter. De a à a -h s c’est le 
rouge, dea-t-s à a-h 2s c’est le noir; la probabilité de 
chaque secteur rouge est donc la même que celle du secteur 
noir suivant, et, par conséquent, la probabilité totale du 
rouge est égale à la probabilité totale du noir. 

La donnée de la question, c’est la fonction analytique qui 
représente la probabilité d’une impulsion initiale détermi¬ 
née. Mais le théorème reste vrai, quelle que soit cette don¬ 
née, parce qu’il dépend d’une propriété commune à toutes 
les fonctions analytiques. Il en résulte que, finalement, 
nous n’avons plus aucun besoin de la donnée. 

Ce que nous venons de dire pour le cas de laQouIette 
S’applique aussi à l’exemple des petites planètes. Le zodiaque 
peut être regardé comme une immense roulette sur la¬ 
quelle le Créateur a lancé un très grand nombre de petites 
boules, auxquelles il a communiqué des impulsions initiales 
diverses, variant suivant une loi d’ailleurs quelconque. 
Leur distribution actuelle est uniforme et indépendante de 
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cette loi, pour la même raison que clans le cas précédent. 
On voit ainsi pourquoi les phénomènes obéissent aux lois 
du hasard, quand de petites différences dans les causes 
suffisent pour amener de grandes différences dans les effets. 
Les probabilités de ces petites différences peuvent alors 
être regardées comme proportionnelles à ces différences 
elles-mêmes, justement parce que ces différences sont 
petites et que les petits accroissements d’une fonction con¬ 
tinue sont proportionnels à ceux de la variable. 

Passons à un exemple entièrement différent, où intervient 
surtout la complexité des causes; je suppose qu’un joueur 
batte un jeu de cartes. A chaque battement, il intervertit 
l’ordre des cartes, et il peut les intervertir de plusieurs 
manières. Supposons trois cartes seulement pour simplifier 
l’exposition. Les cartes qui, avant le battement, occupaient 
respectivement les rangs 120, pourront, après le battement, 
occuper les rangs 

123 , 23 i, 3 i 2 , 321, i 32 , 2 i 3 . 

Chacune de ces six hypothèses est possible et elles ont 
respectivement pour probabilités 

P\> P11 Pîi Pii Ps> Ps- 

La somme de ces six nombres est égale à r ; mais c’est 
tout ce que nous en savons; ces six probabilités dépendent 
naturellement des habitudes du joueur, que nous ne con¬ 
naissons pas. 

Au second battement et aux suivants, cela recommencera 
et dans les mêmes conditions; je veux dire que /> 4 , par 
exemple, représente toujours la probabilité pour que les 
trois cartes qui occupaient après le rc e battement et avant 
le (n +-1)' les rangs 1 2 3 , pour que ces trois cartes, dis-je, 
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occupent les rangs 32 1 après le (n-+-i) e battement. Et cela 
reste vrai, quel que soit le nombre n, puisque les habitudes 
du joueur, sa façon de battre restent les mêmes. 

Mais, si le nombre des battements est très grand, les cartes 
qui, avant le i er battement, occupaient les rangs 123 , pour¬ 
ront, après le dernier battement, occuper les rangs 

123, 23i, 3i2, 321, i32 2i3, 

et la probabilité de ces six hypothèses sera sensiblement la 
même et égale à g; et cela sera vrai, quels que soient les 

nombres p u ...,/> 6 , que nous ne connaissons pas. Le grand 
nombre des battements, c’est-à-dire la complexité des 
causes, a produit l’uniformité. 

Cela s’appliquerait sans changement, s’il y avait plus de 
trois caries; mais, même avec trois cartes, la démonstration 
serait compliquée; je me contenterai ici de la donner pour 
deux cartes seulement (*). Nous n’avons plus que deux 
hypothèses 

J 2, 2 1, 

avec les probabilités/ij et/> 2 = i—/>!• Supposons n batte¬ 
ments, et supposons que je gagne i franc si les cartes sont 
finalement dans l’ordre initial, et que j’en perde i si elles 
sont finalement interverties. Alors, mon espérance mathé¬ 
matique sera 

(Pi—Pi)' 1 - 

La différence p t — p 2 est certainement plus petite que i; 
de sorte que, si n est très grand, mon espérance sera nulle; 
nous n’avons pas besoin de connaître p t el p 2 pour savoir 
'que le jeu est équitable. 


Q) Voir un calcul plus complet au Chapitre intitulé : Questions 
diverses. 
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Il y aurait une exception toutefois, si l’un des nombres 
p ± et p 2 était égal à r et l’autre nul. Cela ne marcherait plus 
alors, parce que nos hypothèses initiales seraient trop simples. 

Ce que nous venons devoir ne s’applique pas seulement 
au mélange des cartes, mais à tous les mélanges, à ceux 
des poudres et des liquides, et même à ceux des molécules 
gazeuses dans la théorie cinétique dés gaz. Pour en revenir 
à celte théorie, supposons, pour un instant, un gaz dont les 
molécules ne puissent se choquer mutuellement, mais 
puissent être déviées par des chocs sur les parois du vase 
où le gaz est renfermé. Si la forme du vase est suffisamment 
compliquée, la distribution des molécules et celle des vitesses 
ne tarderont pas à devenir uniformes. Il n’en sera plus de 
même si le vase est sphérique ou s’il a la forme d’un parallé¬ 
lépipède rectangle. Pourquoi? Parce que, dans le premier 
cas, la distance du centre à une trajectoire quelconque 
demeurera constante; dans le second cas, ce sera la valeur 
absolue de l’angle de chaque trajectoire avec les faces du 
parallélépipède. 

On voit ainsi ce que l’on doit entendre par conditions trop 
simples; ce sont celles qui conservent quelque chose, qui 
laissent subsister un invariant. Les équations différentielles 
du problème sont-elles trop simples pour que nous puis¬ 
sions appliquer les lois du hasard? Cette question paraît, au 
premier abord, dénuée de sens précis; nous savons mainte¬ 
nant ce qu’elle veut dire. Elles sont trop simples, si elles 
conservent quelque chose, si elles admettent une intégrale 
uniforme ; si quelque chose des conditions initiales demeure 
inaltéré, il est clair que la situation finale ne pourra plus 
être indépendante de la situation initiale. 

Venons enfin à la théorie des erreurs. A quoi sont dues 
les erreurs accidentelles, nous l’ignorons, et c’est justement 
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parce que nous l’ignorons que nous savons qu’elles vont 
obéir à la loi de Gauss. Tel est le paradoxe. Il s’explique à 
peu près de la même manière que dans les cas précédents. 
Nous n’avons besoin de savoir qu’une chose : que les erreurs 
sont très nombreuses, qu’elles sont très petites, que cha¬ 
cune d’elles peut être aussi bien négative que positive. 
Quelle est la courbe de probabilité de chacune d’elles? Nous 
n’en savons rien, nous supposons seulement que cette 
courbe est symétrique. On démontre alors que l’erreur 
résultante suivra la loi de Gauss, et cette loi résultante est 
indépendante des lois particulières que nous ne connais¬ 
sons pas. Ici, encore, la simplicité du résultat est née de ia 
complication même des données. 

VI 

Nous avons cherché à définir le hasard, et il convient 
maintenant de se poser une question. Le hasard, étant ainsi 
défini dans la mesure où il peut l’être, a-t-ii un caractère 
objectif? 

On peut se le demander. J’ai parlé de causes très petites 
ou très complexes. Mais ce qui est très petit pour l’un ne 
peut-il être grand pour l’autre, et ce qui semble très com¬ 
plexe à l’un ne peut-il paraître simple à l’autre? J’ai déjà 
répondu en partie, puisque j’ai dit plus haut, d’une façon 
précise, dans quel cas des équations différentielles devien¬ 
nent trop simples pour que les lois du hasard restent appli¬ 
cables. Mais il convient d’examiner la chose d’un peu plus 
près, car on peut se placer encore à d’autres points de vue. 

Que signifie le mot très petit? Il suffit, pour le com¬ 
prendre, de se reporter à ce que nous avons dit plus haut. 
Une différence est très petite, un intervalle est très petit. 
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lorsque, dans les limites de cet intervalle, la probabilité 
reste sensiblement constante. Et pourquoi cette probabilité 
peut-elle être regardée comme constante dans un petit 
intervalle? C’est parce que nous admettons que la loi de 
probabilité est représentée par une courbe continue; et 
non seulement continue au sens analytique du mot, mais 
pratiquement continue, comme je l’expliquais plus haut. 
Cela veut dire que, non seulement, elle ne présentera pas 
d’hiatus absolu, mais qu’elle n’aura pas non plus de sail¬ 
lants et de rentrants trop aigus ou trop accentués. 

Et qu’est-ce qui nous donne le droit de faire celte hypo¬ 
thèse? Nous l’avons dit plus haut, c’est parce que, depuis le 
commencement des siècles, il y a des causes complexes qui 
ne cessent d’agir dans le même sens et qui font tendre cons¬ 
tamment le monde vers l’uniformité, sans qu’il puisse jamais 
revenir en arrière. Ce sont ces causes qui ont peu à peu 
abattu les saillants et rempli les rentrants, et c’est pour cela 
que nos courbes de probabilité n’offrent plus que des ondu¬ 
lations lentes. Dans des milliards de milliards de siècles, 
on aura fait un pas de plus vers l’uniformité et ces ondula¬ 
tions seront dix fois plus lentes encore : le rayon de cour¬ 
bure moyen de notre courbe sera devenu dix fois plus 
grand. El, alors, telle longueur, qui, aujourd’hui, ne nous 
semble pas très petite, parce que sur notre courbe un arc 
de cette longueur ne peut être regardé comme rectiligne, 
devra, au contraire, à cette époque, être qualifiée de très 
petite, puisque la courbure sera devenue dix fois moindre, 
et qu’un arc de cette longueur pourra être sensiblement 
assimilé à une droite. 

Ainsi ce mot de très petit reste relatif; mais il nîest pas 
relatif à tel homme ou à tel autre, il est relatif à l’état ac¬ 
tuel du monde. Il changera de sens quand le monde sera 
P. 3 
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devenu plus uniforme, que toutes les choses se seront 
mélangées plus encore. Mais alors, sans doute, les hommes 
ne pourront plus vivre et devront faire place à d’autres 
êtres; dois-je dire beaucoup plus petits ou beaucoup plus 
grands? De sorte que notre critérium, restant vrai pour tous 
les hommes, conserve un sens objectif. 

Et que veut dire, d’autre part, le mot très complexe? J’ai 
déjà donné une solution, et c’est celle que j’ai rappelée au 
début de ce paragraphe, mais il y en a d’autres. Les causes 
complexes, nous l’avons dit, produisent un mélange de plus 
en plus intime, mais au bout de combien de temps ce 
mélange nous satisfera-l-il ? Quand aura-t-on accumulé 
assez de complications? Quand aura-t-on suffisamment 
battu les cartes? Si nous mélangeons deux poudres, l’une 
bleue, l’autre blanche, il arrive un moment où la teinte du 
mélange nous parait uniforme; c’est à cause de l’infirmité de 
nos sens; elle sera uniforme pour le presbyte qui est obligé 
de regarder de loin, quand elle ne le sera pas encore pour le 
myope. Et quand elle le sera devenue pour toutes les vues, 
on pourra encore reculer la limite par l’emploi des instru¬ 
ments. Il n’y a pas de chance pour qu’aucun homme dis¬ 
cerne jamais la variété infinie qui, si la théorie cinétique est 
vraie, se dissimule sous l’apparence uniforme d’un gaz. Et, 
cependant, si l’on adopte les idées de Gouy sur le mouve¬ 
ment brownien, le microscope ne semble-t-il pas sur le 
point de nous montrer quelque chose d’analogue ? 

Ce nouveau critérium est donc relatif comme le premier, 
et, s’il conserve un caractère objectif, c’est parce que tous 
les hommes ont à peu près les mêmes sens, que la puissance 
de leurs instruments est limitée et qu’ils ne s’en servent 
d’ailleurs qu’exceptionnellement. 
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VU. — La. probabilité dans les sciences morales. 

C’est la même chose dans les sciences morales et en par¬ 
ticulier dans l’histoire. L’historien est obligé de faire un 
choix dans les événements de l’époque qu’il étudie; il ne 
raconte que ceux qui lui semblent les plus importants. Il 
s’est donc contenté de relater les événements les plus con¬ 
sidérables du xvi e siècle par exemple, de même que les faits 
les plus remarquables du xvn e siècle. Si les premiers suf¬ 
fisent pour expliquer les seconds, on dit que ceux-ci sont 
et conformes aux lois de l’histoire ». Mais si un grand événe¬ 
ment du XYii e siècle reconnaît pour cause un petit fait du 
xvi e siècle, qu’aucune histoire ne rapporte, que tout le 
monde a négligé, alors on dit que cet événement est dû au 
hasard; ce mot a donc le même sens que dans les sciences 
physiques; il signifie que de petites causes ont produit de 
grands effets. 

Le plus grand hasard est la naissance d’un grand homme. 
Ce n’est que par hasard que se sont rencontrées deux cel¬ 
lules génitales, de sexe différent, qui contenaient précisé¬ 
ment, chacune de son côlé, les éléments mystérieux dont la 
réaction mutuelle devait produire le génie. On tombera 
d’accord que ces éléments doivent être rares et que leur 
rencontre est encore plus rare. Qu’il aurait fallu peu de 
chose pour dévier de sa route le spermatozoïde qui les 
portait; il aurait suffi de le dévier d’un dixième de milli¬ 
mètre et Napoléon ne naissait pas et les destinées d’un con¬ 
tinent étaient changées. Nul exemple ne peut mieux faire 
comprendre les véritables caractères du hasard. 

Un mot encore sur les paradoxes auxquels a. donné lieu 
l’application du calcul des probabilités aux sciences morales. 
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On a démontré qu’aucune Chambre ne contiendrait jamais 
aucun député de l’opposition, ou du moins un tel événement 
serait tellement improbable qu’on pourrait, sans crainte, 
parier le contraire, et parier un million contre un sou. Con¬ 
dorcet s’est efforcé de calculer combien il fallait de jurés 
pour qu’une erreur judiciaire devînt pratiquement impos¬ 
sible. Si l’on avait utilisé les résultats de ce calcul, on se 
serait certainement exposé aux mêmes déceptions qu’en 
pariant sur la foi du calcul que l’opposition n’aurait jamais 
aucun représentant. 

Les lois du hasard ne s’appliquent pas à ces questions. Si 
la justice ne se décide pas toujours par de bonnes raisons, 
elle use moins qu’on ne croit de la méthode de Bridoye; 
c’est peut-être fâcheux puisque, alors, le système de 
Condorcet nous mettrait à l’abri des erreurs judiciaires. 

Qu’est-ce à dire ? Nous sommes tentés d’attribuer au 
hasard les faits de cette nature, parce que les causes en sont 
obscures ; mais ce n’est pas là le vrai hasard. Les causes 
nous sont inconnues, il est vrai, et même elles sont com¬ 
plexes; mais elles ne le sont pas assez puisqu’elles conser¬ 
vent quelque chose; nous avons vu que c’est là ce qui 
distingue les causes a trop simples». Quand des hommes 
sont rapprochés, ils ne se décident plus au hasard et indé¬ 
pendamment les uns des autres; ils réagissent les uns sur 
les autres. Des causes multiples entrent en action, elles 
troublent les hommes, les entraînent à droite et à gauche, 
mais il y a une chose qu’elles ne peuvent détruire, ce sont 
leurs habitudes de moutons de Panurge. Et c’est cela qui se 


conserve. 
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VIII. — Réflexions diverses. 

Il y aurait beaucoup d’autres questions à soulever, si je 
voulais les aborder avant d’avoir résolu celle que je m’étais 
plus spécialement proposée. Quand nous constatons un 
résultat simple, quand nous trouvons un nombre rond, par 
exemple, nous disons qu’un pareil résultat ne peut pas être 
dû au hasard, et nous cherchons pour l’expliquer une cause 
non fortuite. Et, en effet, il n’y a qu’une très faible probabi¬ 
lité pour qu’entre ioooo nombres, le hasard amène un 
nombre rond, le nombre joooo par exemple; il y a seule¬ 
ment une chance sur ioooo. Mais il n’y a non plus qu’une 
chance sur ioooo pour qu’il amène n’importe quel autre 
nombre; et cependant ce résultat ne nous étonnera pas, et 
il ne nous répugnera pas de l’attribuer au hasard; et cela 
simplement parce qu’il sera moins frappant. 

Y a-t-il là, de notre part, une simple illusion, ou bien y a- 
t—il des cas où cette façon de voir est légitime? Il faut l’es¬ 
pérer, car, sans cela, toute science serait impossible. Quand 
nous voulons contrôler une hypothèse, que faisons-nous? 
Nous ne pouvons en vérifier toutes les conséquences, puis¬ 
qu’elles seraient en nombre infini; nous nous contentons 
d’en vérifier quelques-unes et, si nous réussissons, nous 
déclarons l’hypothèse confirmée, car tant de succès ne sau¬ 
raient être dus au hasard. Et c’est toujours au fond le même 
raisonnement. 

Je ne puis ici le justifier complètement, cela me prendrait 
trop de temps; mais je puis dire au moins ceci : nous nous 
trouvons en présence de deux hypothèses, ou bien une 
cause simple, ou bien cet ensemble de causes complexes 
que nous appelons le hasard. Nous trouvons naturel d’ad- 
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mellre que la première doit produire un résultat simple, et, 
alors, si nous constatons ce résultat simple, le nombre rond, 
par exemple, il nous paraît plus vraisemblable de l’attribuer 
à la cause simple qui devait nous le donner presque cer¬ 
tainement, qu’au hasard qui ne pouvait nous le donner 
qu’une fois sur ioooo. Il n’en sera plus de même, si nous 
constatons un résultat qui n’est pas simple; le hasard, il 
est vrai, ne l’amènera pas non plus plus d’une fois sur 
ioooo; mais la cause simple n’a pas plus de chance de le 
produire. 

Nous verrons plus loin pourquoi, dans une table de loga¬ 
rithmes, les décimales paraissent distribuées conformément 
aux lois du hasard. On peut se poser la même question en 
ce qui concerne le nombre ît. Ici, elle est plus délicate. 

Nous savons, par exemple, que ce nombre est compris 
entre 3 et 4 , et nous envisageons les n premières décimales; 
considérons la partie entière de io a (n — 3 ), elle est com¬ 
prise entre o et io n ; parmi les io B entiers, compris entre 
ces limites, eonsidérons-en un au hasard, envisageons com¬ 
bien il y figure de chiffres 7 et combien de chiffres 5 , et 
envisageons l’excès du premier nombre sur le second. Soit 
e cet excès. Supposons que parmi nos i<o n nombres, il y eu 

Q 

ail N où le rapporl — soit plus petit que e. 

La loi des grands nombres nous apprend que N. io _n 
tend vers 1, quand n croît indéfiniment. Si donc, nous choi¬ 
sissons entre ces limites un nombre au hasard , la proba¬ 
bilité pour que l’excès e èt les excès analogues soient rela¬ 
tivement très petits, c’est-à-dire la probabilité pour que les 
décimales soient réparties conformément aux lois du 
hasard, sera très voisine de la certitude. 

Mais pourquoi avons-nous le droit de raisonner comme 
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si le nombre % avait été choisi au hasard. Si au lieu de %, 
nous avions envisagé une fraction rationnelle simple, dont 
la réduction en fraction décimale aurait engendré une 
fraction périodique, le résultat n’aurait plus été vrai du 
tout. 

Il semble que le nombre ur nous parait choisi au hasard, 
parce que sa genèse est compliquée et que nous raison¬ 
nons inconsciemment sur lui, comme nous avons coutume 
de le faire sur les effets produits par un ensemble de causes 
compliquées. 



CHAPITRE I. 

DÉFINITION DES PROBABILITÉS. 


1. On ne peut guère donner une définition satisfaisante 
de la Probabilité. On dit ordinairement : la probabilité d’un 
événement est le rapport du nombre des cas favorables à 
cet événement au nombre total .des cas possibles. 

Ainsi, si le premier nombre est n et le second N, la pro¬ 
babilité est cette définition, dans certains cas, ne soulève 
aucune difficulté. Dans un jeu de 32 cartes,la probabilité de 
tirer un roi est puisque le nombre total des cas possibles, 

c’est-à-dire des cartes, est 32, et que parmi ces cartes il y a 
quatre rois; on a donc ici N = 32, n — 4. Quand on jette 

un dé, la probabilité d’amener le point 4 est car N= 6 et 

n — i, le dé ayant 6 faces dont une seule porte le point 4- 
Dans une urne qui contient n boules blanches et p noires, 
on tire une boule; la probabilité qu’elle soit blanche est 

n 

n+p’ 

2. Prenons un exemple un peu plus compliqué. Deux 
urnes, qui ne diffèrent pas extérieurement, renferment la 
première n boules blanches et p noires, la seconde n' blan¬ 
ches et p' noires. 
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On fait tirer une boule à une personne, et on demande 
quelle est la probabilité pour amener blanche. On pourrait 
dire que le nombre total des cas est « -t- n' -+-p -+-p' et que 

la probabilité est- w ,~*~ n -». On peut dire aussi que 

n -t- tv -h p -h p r 1 

deux cas peuvent d’abord se présenter, soit la première, soit 
la seconde urne; la probabilité de prendre dans la première 

est-» et dans la seconde -> car il v a autant de chances de 
2 2 J 

mettre la main dans l’une que dans l’autre. Si j’ai mis la 

main dans la première urne, la probabilité est -^- pour 

que, prenant dans la première urne, on ait une boule blan¬ 
che; en vertu du théorème de la probabilité composée, que 
je ne tarderai pas à établir, la probabilité de mettre à la 
fois la main dans la première urne et d’en tirer une boule 

blanche est ^ ; la probabilité analogue pour la seconde 

1 n' 

urne est-»-» • 

2 n' -h p' 

La somme 

r n i n' 

2 n -+-p -l- 2 n'-t-// 


est l’évaluation correcte de la probabilité demandée, et il 
n’y aura égalité entre les deux évaluations que dans un cas 
particulier 


n _ n' 

n -f-/j n'-h p 1 ’ 


c’est-à-dire 


n 

P 


n' 


A quoi tient cette divergence ? A ce que les n -t- n' -t- p -{- p 
cas ne sont pas également probables. 

Ainsi, supposons qu’il y ait deux fois plus de boules dans 
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la première urne 

La probabilité pour que je prenne une boule donnée dans 
cette urne est ; et pour que je la prenne dans la 

seconde elle est;—-—-■ 

(« + />) 

A la définition de la probabilité, il faut donc ajouter : à 
condition que tous les cas soient également vraisemblables. 
Citons deux autres exemples dus à Bertrand. 

3. Problème des trois coffrets. — Trois coffrets iden¬ 
tiques, A,B,C, ont chacun deux tiroirs, oc, (3 ; ceux de A 
contiennent chacun une pièce d’or, ceux dé B une pièce 
d’argent, et ceux de' C ont l’un une pièce d’or, l’autre une 
pièce d’argent : 

AB G 

ce or argent or 

(3 or argent argent. 

Quelle est la probabilité pour que, en ouvrant au hasard 
un des six tiroirs, l’on ait une pièce d’or? Six cas sont éga¬ 
lement probables : A ce, A|3, B a, B (3, Ca, C|3; de ces six cas, 
trois sont favorables à l’arrivée de la pièce d’or : Ace,A|3,Cee. 

La probabilité est donc ~ 

Si l’on prend un des trois coffrets au hasard, la probabi¬ 
lité pour prendre C esti- 

J’ouvre au hasard un des tiroirs, j’y trouve une médaille 
d’or; quelle est la probabilité pour que la deuxième mé¬ 
daille soit en argent? 
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Ou bieü, je suis tombé sur le coffret C, ou bien sur le 
coffret A : dans le premier cas, la seconde médaille sera 
en argent, dans le second en or. La probabilité semble 

donc —• Cette conclusion est fausse. 

2 

Avant d’ouvrir le tiroir, je savais que j’y trouverais une 
pièce d’or ou une pièce d’argent avec une probabilité égale, 

c’est-à-dire^; or, je puis trouver la pièce d’or dans trois 

cas. Ace, A (3, Ca, et de ces trois cas un seul, Ca, est favorable 
à l’arrivée de la pièce d’argent dans le second tiroir. 

Dans la première évaluation de la probabilité à ^ > les deux 

cas envisagés étaient inégalement probables : le cas A cor¬ 
respond à Ace et à A(3, et est deux fois plus probable que le 
cas C, qui ne correspond qu’à Ca. 

4. Problème du jeu de boules. — Deux joueurs éga¬ 
lement habiles, Pierre et Paul, jouent aux boules; Pierre a 
deux boules à lancer, Paul une boule, et la victoire est à 
celui des deux dont l’une des boules approchera le plus du 
but. 

Quelle est la probabilité pour que Paul gagne? 

Soient A et B les boules de Pierre, C celle de Paul; six 
cas peuvent se présenter, en rangeant les boules suivant 
leur proximité du but. 

ABC, B CA, CAB, ACB, CB A, BAC. 

Ces six cas sont également probables; ceux qui donnent 
la victoire à Pierre sont au nombre de quatre, ceux qui 
donnent la victoire à Paul au nombre de deux : la proba¬ 
bilité de gagner est donc ^ pour Paul. 
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Oh pourrait raisonner autrement : la boule A de Pierre 
est plus éloignée du but que C, ou bien c’est le contraire. 

A>C ou A<C. 

De même pour la boule B 

B > C ou B < C. 

Donc quatre cas sont possibles 

A >.C avec B > C, 

A < C » B > C, 

A > G » B < C, 

A < G » B < C. 

Un seul cas, le premier, est favorable à Paul, puisque, sa 
boule est à la fois plus rapprochée que A et B; la probabilité 

serait donc 7 - 
4 

Mais les quatre cas ne sont pas également probables. 

A>C avec B > C correspond à 2 combinaisons GAB, CBA, 
A < G » B > C » 1 » ACB, 

A > C » B < C » 1 » BCA, 

A <c C » B < C » 2 » ABC, BAC. 

5. La définition complète de la probabilité est donc une 
sorte de pétition de principe : comment reconnaître que 
tous les cas sont également probables? Une définition 
mathématique ici n’est pas possible; nous devrons, dans 
chaque application, faire des conventions, dire que nous 
considérerons tel et tel cas comme également probables. 
Ces conventions ne sont pas tout à fait arbitraires, mais 
échappent à l’esprit du mathématicien qui n’aura pas à les 
examiner, une fois qu'elles seront admises. 
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Ainsi tout problème de probabilité offre deux périodes 
d’étude : la première, métaphysique pour ainsi dire, qui 
légitime telle ou telle convention; la seconde, mathéma¬ 
tique, qui applique à ces conventions les règles du calcul. 

6 . Nous allons grouper les questions dont nous nous 
occuperons, d’après divers points de vue et, d’abord, au 
point de vue des cas possibles. 

Dans une première catégorie, nous rangerons toutes 
celles où le nombre de cas possibles est fini, ne dépasse 
pas certaines limites; en général, nous aurons affaire à des 
jeux de hasard, à de simples problèmes d’analyse combina¬ 
toire. 

Dans une deuxième catégorie, le nombre des cas pos¬ 
sibles reste fini, mais devient très grand; on n’a plus alors 
qu’une expression approchée de la probabilité par la loi des 
grands nombres, le théorème de Bernoulli, etc. C’est ce 
qui se présente en statistique. 

Dans une troisième catégorie, le nombre des cas possi¬ 
bles est indéfini. 

Ainsi, on lance une aiguille sur une feuille de papier où 
sont tracées des lignes parallèles : la probabilité pour que 
l’aiguille rencontre une de ces lignes dépend d’un nombre 
infini de cas possibles. 

C’est dans ce cas surtout qu’il faut définir, avec le plus 
grand soin, les conventions préalables. 

On sait, par exemple, qu’un nombre æ, fractionnaire ou 
incommensurable, est compris entre 0 et 1 , et on demande 

la probabilité pour qu’il soitcompris entre 0 et^ : le nombre 
des cas possibles est infini. On serait tenté de dire que la 
probabilité est cependant on pourrait dire aussi que 
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si o <.x le carré de x, soit/, est compris entre o et 

Puisque x i =y, et que x est compris entre o et i, on a 
o </< i. Les cas favorables sont tous ceux pour lesquels 

o si l’on divise l’intervalle compris entre o et i en 

quatre parties égales, la probabilité pour que y soit compris 
i r 

entre o et 7 est 
4 4 

Ce serait pourtant une erreur grossière d’évaluer égale- 



En effet, dans la première évaluation, nous considérons 
comme également probables les deux hypothèses 

j?o < x < x a s et œi<œ<æ[+£| 

l’intervalle e étant le même; tandis que, dans la seconde 
évaluation, nous considérons comme également probables 
les deux hypothèses 

Æ-jj < x ï <-t- s et xi<Zx-<Zx\-{- s; 

ces deux conventions sont contradictoires. 

Ici, x est une constante arbitraire; plus haut, dans le 
problème de l’aiguille, il y avait trois constantes arbitraires, 
les coordonnées du milieu de l’aiguille et sa direction. Dans 
d’autres problèmes de probabilités, il y a encore plus de 
constantes arbitraires, il y a même des lois arbitraires. 
Ainsi y—f{x) est une fonction qui peut paraître plus pro¬ 
bable que telle autre, ce qui arrive entre autres quand on 
interpole. C’est là une quatrième catégorie de problèmes. 

7. Plaçons-nous à un autre point de vue. 

Une question de probabilités ne se pose que par suite de 
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notre ignorance : il n’y aurait place que pour la certitude si 
nous connaissions toutes les données du problème. D’autre 
part, notre ignorance ne doit pas être complète, sans quoi 
nous ne pourrions rien évaluer. Une classification s’opé¬ 
rerait donc suivant le plus ou moins de profondeur de notre 
ignorance. 

Ainsi la probabilité pour que la sixième décimale d’un 
nombre dans une table de logarithmes soit égale à 6 est a 

priori de en réalité, toutes les données du problème sont 

bien déterminées, et, si nous voulions nous en donner la 
peine, nous connaîtrions exactement celte probabilité. De 
même, dans les interpolations, dans le calcul des intégrales 
définies par la méthode de Cotes on celle de Gauss, etc. 

Notre ignorance est plus grande dans les problèmes de 
Physique; il s’agit de prévoir un événement, c’ëst-à-dire un 
phénomène conséquent qui dépend d’une part d’un phéno¬ 
mène antécédent, et d’autre part de la loi qui unit l’anté¬ 
cédent au conséquent. Il peut se faire que nous connaissions 
la loi, mais non le phénomène antécédent : quelle est la 
probabilité pour que se produise le phénomène consé¬ 
quent ? 

Nous connaissons, par exemple, la loi du mouvement- des 
molécules; si.nous connaissions exactement leur position 
initiale, nous serions capables de dire où elles seront à un 
moment donné; la probabilité pour que ces molécules occu¬ 
pent telle position finale dépendra donc de la probabilité 
que nous attribuerons par convention à telle ou telle posi¬ 
tion initiale. Dans chaque cas, une hypothèse particulière 
est nécessaire. 

Ainsi, quand on cherche la probabilité pour que les 
comètes aient des orbites elliptiques, on est obligé de faire 
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une convention, on suppose qu’à une grande distance du 
Soleil ces astres sont uniformément distribués dans l’espace 
ainsi que les directions de leurs vitesses. 

Autre question analogue:les lacunes qu’offre la série des 
petites planètes sont-elles dues au hasard ? Ici encore, leurs 
positions initiales sont inconnues, mais l’astronome connaît 
la loi de leur mouvement. Comment choisir dans ce cas les 
conventions à faire sur les positions initiales ? 

Il est difficile de le faire sans tomber dans l’arbitraire. 
Cependant, certaines hypothèses semblent tout à fait impro¬ 
bables : on n’admettra pas que les vitesses initiales des 
comètes soient telles qu’elles aient toutes la même excen¬ 
tricité. 

D’un autre côté il peut arriver que certains résultats 
soient, dans une certaine mesure, indépendants de la loi 
admise pour relier les antécédents et les conséquents. Con¬ 
sidérons un très grand nombre de petites planètes, dont 
les moyens mouvements soient tous différents : les rayons 
vecteurs, les longueurs, les vitesses initiales sont distri¬ 
bués d’une façon quelconque. Au bout d’un temps très 
long, ces petites planètes seront également réparties dans 
tous les azimuts. Il y en aura un même nombre dans des 
secteurs égaux. 

8 . Dans d’autres problèmes, enfin, il peut arriver que 
notre ignorance soit plus grande encore, que la loi elle- 
même nous échappe. La définition des probabilités devient 
alors presque impossible. Si, par exemple, æ est une fonc¬ 
tion inconnue de t, nous ne savons pas très bien quelle 
probabilité il faut attribuer, au début, à æ 0 , pour connaître 
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On se laissera souvent guider par un sentiment vague 
qui s’impose avec puissance, qu’on ne saurait pourtant jus¬ 
tifier, mais sans lequel, en tout cas, aucune science ne serait 
possible. Les lois les mieux établies ne le sont que par des 
expériences isolées dont on a été obligé de généraliser les 
résultats. Quand Képler déduisait ses lois des observations 
de Tyeho-Brahé, on aurait pu lui objecter ; « Tyeho-Brahé 
n’a pas toujours regardé le ciel, et, pendant qu’il ne 
l’observait pas, la loi que vous cherchez n’a-t-elle pas 
changé ? » 

Il aurait certainement trouvé l’objection ridicule et 
aurait répondu : a Cette hypothèse est bien invraisem¬ 
blable. » C’eût été là faire appel à ce sentiment mal défini 
de la probabilité. 

9. Un problème plus délicat que celui de la probabilité 
des effets est celui de la probabilité des causes. 

Dans notre urne de tout à l’heure, nous savions qu’il y 
avait n boules blanches et p boules noires; quand nous 
cherchions la probabilité de tirer une blanche, la cause 
était connue : c’était une urne avec n blanches et p noires. 

Mais, problème inverse, je puis savoir qu’il y a en. tout 
n -+-p boules, sans connaître comment elles sont réparties. 
Je tire une noire : quelle est la probabilité pour qu’il y ait 
plus de noires que de blanches? C’est une probabilité de 
cause. 

On en recherche constamment de pareilles en Physique; 
les lois ne nous sont connues que par leurs effets qu’on 
observe. Cherchera en déduire les lois qui sont des causes 
c’est résoudre un problème de probabilité des causes. 

10. Sans insister davantage sur le côté métaphysique des 

P. \ 
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questions de probabilités, et dans le seul but de provoquer 
des réflexions sur ce sujet, je ferai encore remarquer 
qu’une probabilité peut être subjective. L’on a des raisons 
personnelles de croire telle hypothèse plus probable que 
telle autre. 

La probabilité peut aussi s’objectiver, en statistique par 
exemple : le nombre probable des personnes qui mourront 
dans une année est tant; cependant il s’en écartera un peu. 
Dans quelles limites nos prévisions seront-elles vérifiées ? 
Pourquoi seront-elles vérifiées? 

Il y a là quelque chose de mystérieux, d’inaccessible au 
mathématicien. 

Quoi qu’il en soit, l’ordre que je suivrai dans l’exposé 
mathématique des probabilités sera celui que j’ai indiqué 
plus haut. 

Je commencerai par des problèmes où les cas possibles 
sont en nombre limité; puis j’étudierai, au sujet des cas en 
nombre très grand, le théorème de Bernoulli et ses consé¬ 
quences, la probabilité des causes, les problèmes où entrent 
des constantes arbitraires ; le nombre des cas devenant 
infini, j’exposerai la théorie des erreurs, branche, fort 
importante, et j’apprendrai, enfin, à déterminer des lois ou 
des fonctions arbitraires. 



CHAPITRE H. 

PROBABILITÉS TOTALES BT COMPOSÉES. 


11. Le calcul des probabilités repose sur deux théo¬ 
rèmes : le théorème des probabilités totales; le théorème 
des probabilités composées. 

Au sujet de deux événements A et B, on peut se poser 
divers problèmes de probabilité, suivant que l’un de ces 
événements doit se produire, ou tous les deux, ou aucun. 

Ou bien A et B se produiront tous deux, hypothèse que 
j’appellerai AB ; 

Ou bien A se produira, B ne se produira pas, hypothèse 
que j’appellerai AB'; 

Ou bien A ne se produira pas, B se produira, hypothèse 
que j’appellerai A'B ; 

Ou bien ni A, ni B ne se produira, hypothèse que j’ap¬ 
pellerai A’B'. 

Supposons que AB se réalise dansa cas différents 
» AB' » (3 » 

» A'B » y » 

» A'B' » d a 

Le nombre total des cas possibles est a $ -h y -i- 5, que 
l’on suppose par convention également probables. 

Examinons diverses probabilités. 
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La probabilité pour que A se produise est 

... a -i- (3 

cc -h {3 -i- y -i- 

les cas favorables étant AB et AB'. 

La probabilité pour que B se produise est 


(B) 


Pi 


cc-hy 

a- -t-13 -+- y -h â 


La probabilité pour que l’un des deux au moins se pro¬ 
duise est 


(A ou B) 


«-t-ft-t-y 
cc -H {3 -fc* y “H $ 


les trois premières hypothèses AB, AB' et A'B étant favo¬ 
rables. 

La probabilité pour que les deux se produisent est 


(A et B) 


Ph 


a. 

a-h|3 


une seule hypothèse AB étant favorable. 

Nous avons encore à envisager la probabilité pour que A 
se produise, si B s’est produit, 

(A si B) P* = -Z=Z\ 


nous savons d’avance que B s’est produit, par suite le 
nombre des cas possibles s'e réduit, ainsi que celui des cas 
favorables. 

La probabilité pour que À se produise, si B ne s’est pas 
produit, est 

(A si B') 


les cas possibles étant au nombre de. (3 -i- S. 
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La probabilité pour que B se produise, si A s’est produit, 
est 


(B si A) 


Pt 


cc 

a. -+- (3 


La probabilité pour que B se produise, si l’on sait que A 
ne s’est pas produit, est 


(B si A') 


P s 


_JL.. 

y + 5 


12. Les théorèmes annoncés se réduisent à de simples 
identités. 

Examinons p i ,p i ,p s , p^- On a 

Pi-t- Pî = Pi + Pu 

_ « _ « a -h y _ 

a -t- (3 -t- y -t- 5 «-(-y cc -t- p -}— y -f— â P 2 ? 5 ’ 

de même 

Pi.=PiPr- 

Ainsi la somme des probabilités pour que A se produise 
et pour que B se produise est égale à la somme des proba¬ 
bilités pour que l’un des deux au moins se produise et pour 
que tous les deux se produisent 

(A)-h(B) = (A ou B)-h (A et B). 

La probabilité pour que A et B se produisent tous deux 
est égale à la probabilité pour que B se produise, multipliée 
par la probabilité pour que A se produise, quand on sait que 
B s’est produit. 

Ou, inversement, elle est égale à la probabilité pour que 
A se produise, multipliée par la probabilité pour que B se 
produise, quand on suppose que A doit se produire. 

(A et B) = (B) (A si B) = (A) (B si A). 
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18. Supposons, en particulier, a. — o, d’où p i .= o; alors 


Pi~i~ P* — Ps • 


Lorsque les deux événements ne peuvent arriver tous 
deux à la fois, la probabilité de A et celle de B ont pour 
somme la probabilité pour que l’un quelconque se pro¬ 
duise. 

Ainsi, quand un événement peut se produire de deux 
manières différentes, mais que ces deux manières ne peu¬ 
vent arriver simultanément, la probabilité de l’arrivée de 
cet événement est égale à la somme de la probabilité pour 
qu’il se produise de la première manière et de la probabi¬ 
lité pour qu’il se produise de la deuxième manière. 

C’est le théorème des probabilités totales. 


14. Il peut arriver que p s —Pi. Alors 


d’où 


« _ a- f- (3 

a-t-y ce-1 - |3 -t- y -t- ô 5 

a+y _ a-Kfi-f-y-fc-fl 

Cf Cf -t- (3 ’ 


I + Z 


a a- 

cc 4-[3_y -h 


a 

IH-Ê: 

a 


y + 8 

P’ 


<3 

-1 4 - 3 

y 


fl—Z 


Quand cette dernière condition est remplie,on a p ± =p s ; 
on a aussi p l =p 6 , en permutant « avec (3, y avec S; on a 
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encore p 2 =p 7 , car p 2 se permute avec p 2 et p s avec p n \ de 
même p. 2 = p s . 

Ainsi 

Pi—Ps = Pe> 

Pî = Pn — Pi- 

En d’autres termes, la probabilité pour que A se produise 
reste la même si l’on sait que B s’est produit ou si l’on sait 
que B ne s’est pas produit; ou, enfin, la probabilité de A 
est indépendante de B. 

On dit que les deux événements sont indépendants. 

De pu = p u on déduit 


Pi — PiPî '• 

la probabilité pour que les deux évéuements se produisent, 
s’ils sont indépendants, est le produit de la probabilité de 
chacun des deux événements. 

C’est le théorème des probabilités composées. 

15. Dans un jeu de 32 cartes, on tire 2 cartes à la fois. 

La probabilité pour que la première soit un roi est 

Pi=p 

la probabilité pour que la seconde soit un roi est 

**=§ï 

la probabilité pour que les deux cartes tirées soit préci¬ 
sément deux rois est 

_ 4x3 
32 x 3i 
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On cherche parmi tous les arrangements des cartes deux 
à deux, soit 32 x 3 1 , ceux qui sont favorables à l’événement : 
il y en a 4x3, car il y a 4 rois dans le jeu, et on peut 
former avec eux, 2 à 2 , autant d’arrangements qu’avec 
4 lettres 2 à 2 . 

La probabilité pour que, dans les 2 cartes, il y ait au 
moins un roi est 

8 x 3i —r 2 

Pz-Pi + P«-Pi- 32x3i * 

Il faudrait se garder de dire que la probabilité pour que 
l’on ait au moins un roi est le double de la probabilité pour 
que l’on ait un roi. 

Une urne renferme k boules numérotées de 1 à k. Si 
l’on cherche la probabilité d’amener le n° r, en tirant deux 
boules à la fois, le 1 peut figurer soit sur la première boule, 
soit sur la seconde; les deux événements sont incompatibles 
et la probabilité totale est 

2 

Pi-+-Pï=j- 

Revenons aux rois du jeu de cartes. Les événements 
sont-ils indépendants? 

On n’a pas p i =p l p î , mais p i =p l p n . 

En se reportant à la signification de p n , on voit que, si le 
premier événement A s’est produit, il ne reste que trois 
rois et 3i cartes, et la probabilité pour que B arrive est 

3 

P7 ~ 3i ' 

Ainsi 

_ 4x3 

Pi 32 x 3i 
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Autre exemple d’événements indépendants : je jette 
deux dés ; quelle est la probabilité que chacun amène 6 ? 

La probabilité que l’un amène 6 est g; 

— l’autre — 4. 

0 

La probabilité que tous deux amènent 6 est car les 
deux événements sont indépendants. 

16. Celte condition n’est pas toujours aussi évidente, et 
on pourrait faire de ce théorème un usage illégitime qui 
s’est rencontré plusieurs fois. 

Au tir au pistolet, je cherche la loi probable des écarts : 
je ne me suis rien donné, ni sur le tireur, ni sur le pistolet. 
C’est une question dans le goût de « l’âge du capitaine ». 

Prenons cependant deux axes de coordonnées, ayant pour 
origine le centre de la cible : soient x et y les coordonnées 
rectangulaires d’un point M, p et m ses coordonnées po¬ 
laires. 

Le problème reste indéterminé, si nous admettons que 
la probabilité des écarts pst la même dans toutes les direc¬ 
tions. 

La probabilité que M se trouve dans un petit élément de 
surface du peut se figurer par 

f(x,y)du. 

Il faut déterminer f(x,y); cette fonction ne doit dépendre 
que de p pour que la probabilité reste la même dans toutes 
les directions : cette probabilité s’écrira donc 


f(p)da. 
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Cherchons la probabilité pour que l’abscisse du point de 
chute soit comprise entre æ et æ dæ\ elle se représentera 
par 

tp(a;) dæ. 

De même, la probabilité pour que l’ordonnée du point 
de chute soit comprise entre y et y-hdy se représentera 
par 

ty{y)dy. 

Mais on doit supposer que tp et 4 1 sont égaux pour que la 
probabilité reste la même dans toutes les directions; dans 
le second cas, on aura donc 

Hy) d y- 

Le raisonnement va devenir incorrect : cherchons la pro¬ 
babilité pour que M se trouve dans un petit rectangle de 
dimensions dæ et dy. Deux événements doivent se produire 
à la fois : i° l’abscisse est comprise entre æ et æ-{-dæ-, 
2 0 l’ordonnée est comprise entre y et y+dy. 

En vertu du théorème des probabilités composées, la 
probabilité actuelle sera 

®{æ) tp (y) dæ dy. 

D’autre part, cette probabilité s’exprime par/(p) da; on 
a donc 

Prenons les dérivés logarithmiques des deux membres 
par rapport à æ , en tenant compte de ÿ-æ- v 2 , 

?'(æ) __ /'(p) 

?( æ ) /(P) p* 

?'(^) /(P) 

p/(p ) 5 


Ainsi 
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et, par analogie, 

tp'ÜO _ /'(p) 
p/(p)’ 

Le premier membre de chacune de ces équations dépend 
soit de œ, soit dey; comme ils sont égaux, ils sont cons¬ 
tants. 

_ h 

æy(æ) ’ 

loge 9^) = -l-Iog e C, 

kx a 

tp(ar) = Ce 2 . 


Ce raisonnement est incorrect : on a appliqué le théo¬ 
rème des probabilités composées, c’est-à-dire qu’on a sup¬ 
posé les événements indépendants; autrement dil, que les 
écarts suivant l’axe des æ sont indépendants des écarts sui¬ 
vant l’axe des y. 

Décrivons quatre aires égales à da autour des quatre 
sommets A, B, C, D d’un rectangle dont les côtés sont 
parallèles aux axes. Appelons «, (3, y, è les probabilités 
respectives pour que M tombe dans chacun de ces élé¬ 
ments. 

J’ai supposé que l’écart en ordonnée était le même pour 
B et D, situés sur la même parallèle à l’axe des æ ; que 
l’écart en abscisse était le même pour A et B, situés sur la 
même parallèle à l’axe des y; en d’autres termes, que 


cc 

P 


ï 

§’ 


ce qui est une hypothèse absolument gratuite. 


17. Maxwell a commis la même erreur dans la théorie 
des gaz. Considérons un gaz comme formé d’un très grand 
nombre de molécules animées de vitesses différentes; com- 
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ment les vitesses seront-elles distribuées entre les molé¬ 
cules ? 

Choisissons trois axes de coordonnées rectangulaires et, 
par l'origine, menons un vecteur représentant en grandeur, 
direction et sens la vitesse de ces molécules. Évaluons la 
probabilité pour que l’extrémité M du vecteur se trouve 
dans un petit élément de volume dx. 

Si je suppose, ce qui est naturel, les vitesses également 
susceptibles de toutes les directions, cette probabilité se 
représentera par 

f(r) dx. 

La probabilité pour que la première coordonnée soit entre 
x et x-^dx s’écrira <s)(x)dx\ la probabilité pour que 
la seconde coordonnée soit entre y et y + dy s’écrira 
y(y)dy; la probabilité pour que la troisième coordonnée 
soit entre z etz-hdz s’écrira f(z)dz. 

La probabilité pour que M soit dans un petit parallélépi¬ 
pède de deux côtés parallèles aux axes étant f{r)dxdydz, 
si le théorème des probabilités composées était applicable, 
on aurait comme tout a l’heure 

f(r) = <p(£») <p(y) <p(«), 
ce qui est incorrect. 

18. Problème du scrutin. — Ce problème admet une 
solution élégante due à M. ]). André.. 

Deux candidats A et B sont en présence; un électeur 
bien informé sait à l’avance que A aura m voix et B « voix, 
m étant plus grand que n. On demande la probabilité pour 
que A garde la majorité pendant tout le dépouillement du 
scrutin. 
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Pour évaluer le nombre des cas possibles, constatons que 
les m bulletins A et les n bulletins B peuvent se présenter 
dans autant d’ordres différents qu’il y a de permutations 
avec répétition de m lettres A et « lettres B, soit 

{m n) ! 
ml ni 


Je partage ces cas possibles en trois groupes. 

Dans le premier, je range tous les cas où A a la majorité 
au début et la conserve tout le temps, soit N t cas tous favo¬ 
rables. 

Dans le deuxième, je range tous les cas où le premier 
bulletin est un bulletin B; A perd donc la majorité au début; 
ce sont N 2 cas défavorables. 

Dans le troisième, je range tous les cas où A a la majorité 
au début, mais la perd ensuite avant de la retrouver à la 
fin; ce sont N s cas défavorables. 

On a 


n 1+ n,+n 3 = 


(m -t- n) ! 
ml n ! ’ 


et il s’agit de calculer 


N, 


N 1 + N 2 +N 3 

Évaluons N 2 : le premier bulletin dépouillé porte B ; sup- 
primons-le, il reste m bulletins A et (« — i) bulletins B. Le 

nombre des cas possibles est n —ïiJ. et donne la 

r ml (« — i)I 

valeur de N 2 . 

Je vais démontrer que N 3 = N 2 . 


Lemme. — Supposons qu’il y ait égalité de voix dans le 
scrutin : A a q bulletins, B a q bulletins. Admettons égale¬ 
ment que K a la majorité au début, et qu’il la conserve jus- 
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qu’au dernier bulletin , où il la perd, puisqu’il y a finalement 
égalité; le dernier bulletin est donc au nom de B. Dépouil¬ 
lons dans l’ordre inverse : B perdra la majorité au dernier 
bulletin seulement. 

A un moment déterminé du scrutin, on a dépouillé a bul¬ 
letins A, et b bulletins B, et l’on a trouvé a~> b, puisque A 
a la majorité. Il reste à dépouiller q — a bulletins A, et q — b 
bulletins B. 

Dans l’ordre inverse, le scrutin aurait donc montré 
q — b>q — a, 

c’est-à-dire que B aurait eu la majorité. 

Ce lemme établi, revenons au problème qui nous occupe. 
Considérons une combinaison « du troisième groupe 

(«) AABAB | BABAA. 

A a la majorité jusqu’au trait, puis, au bulletin suivant, 
il la perd pour la première fois. A gauche du trait, s’il y a 
q bulletins A, il y a q — i bulletins B, soit en tout 2 q — 1 
bulletins. 

Considérons une autre combinaison, que nous appellerons 
dérivée de «, 

BABAA|AABAB. 

On l’obtient en prenant successivement dans « les bulle¬ 
tins de rang 

2 q, iq —j— 1, 2174-2, ..., m + », 1, 2, ..., 2 q — 1, 

c’est-à-dire en transportant à gauche du trait ce qui était à 
droite, et inversement. 

Le (2 qY bulletin étant, par définition, le premier qui fait 
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perdre à A sa majorité, chaque combinaison « a une dérivée 
et une seule. 

Considérons maintenant une combinaison (3 du second 
groupe : elle commence par B 

( (3) BABAAABA; 

A a la majorité à la fin. 

Formons une combinaison j3' de la manière suivante : 
d’abord le premier bulletin B, puis le dernier bulletin de £3, 
puis le pénultième, etc., c’est-à-dire les bulletins de (3 en 
ordre inverse jusqu’au second, 

((3') BABAAABA. 

11 est clair que B a d’abord la majorité, puis qu’il finit par 
la perdre. 

Supposons que le ( 2 p) e bulletin fasse perdre, pour la pre¬ 
mière fois, la majorité à B ; ici, c’est le second. 

La combinaison f3' sert à définir le nombre p : il n’y en a 
qu’un. 

Le bulletin qui occupe dans (3' le ( 2 p) B rang occupe dans 
(3 le (m. -+- n 4 - 2 — 2 p) e rang. 

Dans (3, je place un trait avant le terme qui occupe ce - 
rang 

((3) BABAAAB | A. 

Considérons enfin la combinaison suivante, que je dési¬ 
gnerai par y et que j’appellerai la dérivée de (3; je com~ 
mence par les bulletins à droite du trait (ici il n’y en a 
qu’un), et je reprends tous ceux qui sont à gauche. 

(y) 


A | BABAAAB. 
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Les bulletins de p ont été pris dans l’ordre 
TW-l-rt-H 2 — ip, ..., m-i-n, i, 2 , m-i-n — 2 p, — 2 p. 

Je dis que cette dérivée, appartient toujours au troisième 
groupe. 

D’abord le (m -i-n -+- 2 — ip ) e bulletin doit être A, puisque 
dans P' il fait perdre la majorité à B; donc y commence 
par A. 

A ne conservera pas tout le temps la majorité. En effet, 
les 2 p premiers bulletins de y sont, dans un ordre différent, 
les 2 p premiers bulletins de P'; et par hypothèse, après le 
dépouillement de ces 2 p bulletins, il y avait égalité entre 
les deux candidats. 

Donc, dans y, A aura perdu la majorité et y appartiendra 
au troisième groupe. 

Ainsi, toute combinaison du second groupe a une dérivée, 
et une seule appartenant au troisième groupe. 

Si, pour une combinaison « appartenant au troisième 
groupe, je forme sa dérivée p, puis la dérivée de (3, je dis 
que je retombe sur «. 

Démontrons que le q de a correspond au p de (3. 

En effet, formons £3' 

(PO BBABAA [ AABA. 

Si je prends les 2 q premiers bulletins de p', ce sont pré¬ 
cisément les 2 q premiers bulletins de a. dépouillés dans un 
ordre inverse, et, d’après le lemme, B n’y perdra la majo¬ 
rité qu’à la fin; or, nous savons, d’autre part, que B ne perd 
la majorité dans j3' qu’au ( 2 p) e bulletin; donc 

p—q 


et la dérivée de p sera «. 
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Si j’ai affaire à une combinaison (3, j'en forme la dérivée 
y : réciproquement la dérivée de (3 sera «. 

On peut dire que les combinaisons du second groupe 
sont conjuguées avec celles du troisième, de telle façon que 
chaque combinaison d’un groupé soit la dérivée de sa con¬ 
juguée de l'autre groupe. 

Donc 

N 3 =N 2 ; 


N 2 -i-N 3 =2 


(m 4- n — i)l 
1 n\(n — i)l ’ 


N 2 —{—N 3 2 Tl 

N t —f- N 2 -1 - Ns /n -1 - 


C’est la probabilité que A n’aura pas toujours la majorité; 


et 


N t 

Nt + N,-t-N 


i 


3 


2 n _ m — n 

m-i- n m n 


est la probabilité qu’il la gardera tout le temps. 


19. Problème des dés. — On jette n dés et on demande 
la probabilité d’amener un point total égal à K. 

Supposons d’abord qu’il ne s’agisse que de deux dés; 
avec chacun d’eux, six cas différents peuvent se présenter, 
et les deux réunis offrent trente-six combinaisons. 

i i 

12 2 1 
i 3 2 2 

i 4 ■ . 

i 5 . . 

r 6 . . 

2 6 


P. 


5 
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Une seule correspond au point K= 2 

2 correspondent au point ... K = 3 

3 — — . . . K = 4 


— ... K =12 


La probabilité d'amener 2 est 


36 


3 

h 


36 

3_ 

36 


Prenons le problème plus général de n dés; le nombre 
total des cas possibles est 6 re : en effet, soit a, a 2 ... ct. n une 
des combinaisons, chacun des nombres a. est susceptible 
de six valeurs, 1 , 2 , 3, ..., 6; donc le nombre cherché est 
celui des combinaisons avec répétition de six lettres n à n, 
soit 6 n . 

Le point total devant être un nombre donné à l'avance, K, 
«1 “H CC 2 -t - . • . Kn-*- ÏU 

Considérons l’un des 6 re cas possibles, et, à ce cas, faisons 
-correspondre le monome 

.. 1%. 

Faisons la somme II de ces monomes en faisant varier 
st,, « 2 ,..., « re de 1 à 6. 

qui peut s’écrire 

— (^ 1 —f— —l - * --1 ) (4 + ^2 -H... -t- ïf) ... (tn-t-ïj-t- ... -h^n). 
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C’est un produit de n facteurs; faisons-y 

Le monome deviendra 


^0Cl.~f*CCg » .-H CC/t — 


et le polynôme II se réduira à 

Soit N le nombre des cas favorables; il y a N monomes 
égaux à t K , leur somme est Ni K , et si l’on fait 2Nï K , pour 
toutes les valeurs possibles de K 

2Nf K =H. 

N 

La probabilité demandée est 

La valeur de N est facile à calculer. 

Il est la puissance n e d’une somme de termes en pro¬ 
gression géométrique 

n = {~j) =(f-f T )“(i-O"»; 

(t — f‘) n et (i — t)~ n peuvent se développer par la formule 
du binôme; en faisant le produit des deux développements, 
j’aurai le coefficient de t K , c’est-à-dire N. 

Reprenons le cas de deux dés. Il devient ( t — f 7 ) 2 (i — f) -2 , 
et l’on a 

(t— 2f»-hi 1 S 

(i — f 2 ) -2 = i -t- 2 £ -+- 3 £ 2 -t-.... 

Évaluons le coefficient de t K en faisant le produit de ces 
deux développements. D’abord, K ne peut dépasser 12 ; puis 
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nous considérerons deux cas, suivant que le point est de 2 à 
7 ou de 8 à 12. 

Si le point K est au plus égal à 7, K < 8, il n’y a à faire 
intervenir ni t s , ni f 14 dans le premier développement, et 
l’on n’aura à considérer que. 

t 2 -\- 2< 3 -|- 3< 4 4-. . .-t-ôf 7 . 

Ainsi, pour les points 2, 3 , 4 » ...., 7, N a les valeurs res¬ 
pectives 1, 2 ? 3 ,..., 6. 

Si K est égal ou supérieur à 8, il ne faut pas envisager 
£ 14 , et l’on n’aura affaire qu’à 

it 2 ( 1 -S— 2 i -f— ... ) — 2 ( 1 2 1 — H . .. ) . 

Le coefficient de dans le premier monome sera K— 1. 

Le coefficient de if 8 dans le second monome sera — 2; 
celui de t 9 , — 4 î •••; celui de t K , — 2 (K— 7). Ainsi 

N = K — 1— 2(K — 7 )—i 3 — K. 

On trouverait des expressions plus compliquées pour 
n > 2. 

20 . Problème de la loterie. — Dans une urne, il y a y 
boules numérotées de 1 à y; on en tire n; quelle est la pro¬ 
babilité pour qu’il y ait K boules désignées d’avance? 

Les n boules tirées portent des numéros différents entre 
eux et compris entre 1 et y. 

Les cas possibles sont en même nombre que les arran¬ 
gements de y lettres n à n, si l’on tient compte de l’ordre 
de sortie 

_üL_. 

(p.—/i)i 
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Quand il reste (j .— i-t- i boules, chacune d’elles a même 
chance de sortie que les autres ; nous supposerons toutes 
les sorties également probables. 

Si l’on ne considère pas l’ordre, le nombre des cas pos¬ 
sibles ne sera plus que celui des combinaisons de [i lettres 
n à n, 

((jl — «)! «! 

Je ne considère plus comme distinctes les hypothèses 
qui ne diffèrent que par l’ordre de sortie. Toutes les com¬ 
binaisons restent-elles également probables comme les 
arrangements? Oui, car chacune correspond à «1 arran¬ 
gements. 

Le nombre des cas favorables est celui des combinaisons 
oèl entrent les K boules désignées; il en reste, après leur 
suppression,^. — K dans l’urne. Donc le nombre des cas 
favorables est le nombre des combinaisons de [x — K lettres 
n — K à « — IL 

(E-K)l 

(fi — «)! (« — K)! 

La probabilité d’amener K numéros désignés à la loterie 
est donc 

(ft —K)!«I 
ftl (n — K)! " 


21. Problème de la poule. — Trois joueurs A, B, G 
jouent aux conditions suivantes. Deux d’entre eux A et B 
jouent ensemble; C ne joue pas. Le perdant sort et est 
remplacé par C. Après chaque partie, le perdant est rem¬ 
placé. Le jeu prend fin quand un joueur gagne deux fois de 
suite. 

On suppose naturellement que le jeu est un jeu de 
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hasard, et que la probabilité de gagner une partie est ^ 
pour chaque joueur. 

Par exemple, on peut avoir : 

impartie AB; A gagne; 

2 e partie AG; si A gagne, il est le gagnant définitif; 
si C gagne, B rentre; 

3 e partie BC; si G gagne, il est le gagnant définitif; 
si B gagne, A rentre ; 

4 e partie BA; et ainsi de suite. 

Admettons que A ait gagné la première partie. On de¬ 
mande la probabilité pour chacun des joueurs d’être le 
gagnant définitif. Soient æ, y, z ces probabilités pour 
A, B, G. 

Deux hypothèses sont d’abord possibles. Si A gagne la 
deuxième partie, c’est le gagnant définitif, et les probabilités 
des trois joueurs deviendront i, o, o. 

Si A perd, A prend la place de G, B se trouve dans les 
conditions de A, et C rentre comme B; les probabilités de¬ 
viennent z, æ, y. 

Appliquons le théorème des probabilités totales et le 
théorème des probabilités composées. 

A peut devenir gagnant définitif par deux hypothèses qui 
s’excluent l’une l’autre : 

i° En gagnant la partie considérée; 

2 ° En la perdant. 

La probabilité pour que A soit gagnant définitif est donc 

1 i 

æ = - x i 4— z. 

2 2 
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B ne peut gagner que d’une manière : A perd la partie 
considérée, et B devient gagnant définitif ensuite. 

i 

Y — — as. 

J 2 

De'même pour C la probabilité sera 

i 

D’où 


On remarquera que as +y + z= r ; lorsqu’il y a plusieurs 
événements possibles et de telle façon que l’un d’eux et 
un seulement doive nécessairement arriver, la somme de 
leurs probabilités est i, mais ce n’est pas ici absolument le 
cas, car la partie pourrait se prolonger indéfiniment. Ici 
notre somme est i parce que la probabilité pour que la 
partie se prolonge indéfiniment est o. 

On vient de supposer que A avait gagné la première 
partie. Plaçons-nous au commencement du jeu; avant la 
première partie, C est dehors. 

Deux hypothèses : A gagnera ou B gagnera. 

Si c’est A, B sortira, C entrera et les probabilités pour 
chacun deviendront 

421 

—, —, —• 

7 7 7 

Si c’est B, elles deviendront 

142 

— J —J ~• 

7 7 7 



A peut devenir gagnant définitif : soit en gagnant la pre- 
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mière partie, soit en la perdant. La probabilité de la pre¬ 
mière hypothèse s’obtient par le produit de la probabilité 
pour A de gagner la première partie et de la probabilité pour 


i 4- 

devenir gagnant définitif, soit - x-. La probabilité de la se¬ 


conde hypothèse est de même — x A 

On arrive ainsi aux probabilités totales suivantes : 

« . i 4 i i 5 

Pour A, - X - + - X-=— 7 » 

2 7 2 7 14 


5 

Pour B, la même, — r ; 

14 

Pour C, sans la calculer autrement, 


* 4 ’ 



CHAPITRE m. 

L’ESPÉRANCE MATHÉMATIQUE. 


22. A un certain moment d’un jeu, un joueur a la proba¬ 
bilité p pour qu’il gagne; l’enjeu à empocher est a. 

Par définition, l’espérance mathématique est pa. Bien 
entendu, si a est une perte, pa. est négatif. 

Si plusieurs hypothèses, de probabilités respectives 
Pu Pu ••uPm amènent des gains respectivement égaux à 
a„ a 3 , •■•!<*«> la définition de l’espérance mathématique sera. 


• - + Pa <Z,i- 

Un jeu est équitable lorsque l’espérance mathématique 
est la même pour tous les joueurs. 

Pour faciliter certaines questions, on convient parfois 
d’introduire des joueurs fictifs dont on évalue l’espéFance 
mathématique. 

Soient deux événements, A et B. 

La probabilité de l’arrivée de A est. p v 

— — B est. p 2 

— — A ou de B est. p 3 

— — A et de B est. p * 


On a 


Pl+Pi—Pz+Pu 


Si les deux événements étaient incompatibles, on aurait 
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dans cette formule p w = o, c’est-à-dire le théorème de la 
probabilité totale; mais je suppose qu’il n’en soit pas ainsi. 

Le gain à réaliser est de i fr si A se produit; de inégale¬ 
ment si B se produit. 

L’espérance mathématique totale, en tenant compte des 
deux événements, sera pi-i-p^. 

Ainsi, qne les événements soient compatibles ou non, 
l’espérance mathématique totale est la somme des espé¬ 
rances mathématiques partielles. 

Si les deux événements se produisaient, le joueur tou¬ 
cherait 2 fr . 

Cas plus compliqué : Un certain nombre d’événements 
A*, A a , ..., A q sont possibles : la probabilité pour que .A/ se 
produise est p t , la probabilité pour qne Af et A* se produi¬ 
sent à la fois est p ib , la probabilité pour que Af, A y - et A* se 
produisent à la fois est p iJk . 

On promet à un joueur de lui payer i fr pour chaque évé¬ 
nement qui se produit; s’il y en a n, il touchera n francs. 
Son espérance mathématique.totale est la somme de celles 
que lui assure chacun des événements, c’est-à-dire 2pf. 

On lui promet autant de francs qu’il y aura de combinai¬ 
sons de deux événements pris dans la série. Si deux événe¬ 
ments se produisent, il touche i fr ; si trois événements 
A, B, C se produisent, il louche 3 fr , car il y a trois com¬ 
binaisons AB, BC, CA; si n événements se produisent, il 

touche 1 LLü -il francs. 

2 

Quand deux événements Af et A* se produisent, cette 
combinaison lui assurant i fr , l’espérance mathématique est 
p ik , et l’espérance mathématique totale est alors 
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Si n événements se. produisent, et qu’on donne au joueur 

, , „ .. n(n—i)(n —2) 

i tr par groupe de 3 , u touchera alors — -- 

et son espérance mathématique sera 
n(n — j) (n — 2) y 


: . 2.3 


’-'Pijk- 


Jouons maintenant avec les conventions suivantes : je 
paie i fr par événement qui se produit; Je joueur me paie 
i fr par combinaison de deux événements; je-lui paie i fr par 
combinaison de trois événements; il me paie i fr par combi¬ 
naison de quatre événements, etc. 

Événements. 1, 2, 3 , ••• 

Gain du joueur... 1, —1, 1, —1, ... 

Son gain est 

n(n — 1) n(n — — 2) 

a — ri --——- 4 --- ^5 - ■ ■ 


quand il y a n événements réalisés. 
Si n = 0, a= 0. 

On a, en général. 


1 —ff—1— 71 4- 


n(n — 1) n(n — i)(7i—2) 


1.2.3 


■-=(1 —O"- 


Donc, pour n > 0, a= 1. 

Ainsi, quand aucun événement ne se produit, le joueur 
ne touche rien; quand il s’en produit n, il touche toujours 

i fr . 

Son espérance mathématique est 

P = Z Pi— 2 pn : + 2 pijk—.. . 
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D’où, une généralisation du théorème des probabilités 
totales : la probabilité pour que l’un, au moins, des événe¬ 
ments se produise est 


2 Pi — 2 p ik 4- 2pijk —- 


23 . Problème de la rencontre. — Dans une urne, il y a p 
boules numérotées de i à p; je les tire les unes après les 
autres, jusqu’à ce que l’urne soit vide. Il y a rencontre si, 
au i e tirage, je tire la boule numérotée i. 

Cherchons la probabilité pour qu’il y ail au moins une 
rencontre. 

D’abord la probabilité pour qu’il y ait rencontre au rang 


i est -. En effet, il y a en tout autant d’hypothèses possibles 
F 

que de permutation de p lettres, soit p! Combien sont favo¬ 
rables? Celles où la i e boule est au rang i; je puis y per¬ 
muter les p — i autres, donc (p — r) ! cas favorables. La 
probabilité est 


(p-i)l 

Pl ~ F- 


i 

f' 


Cherchons la probabilité pour qu’il y ait rencontre au i e 
et au k e tirage. Deux boules ont un rang déterminé : si nous 
permutons les p —2 autres, nous verrons que le nombre 
des cas favorables est (p— 2)!; la probabilité est 


De même 


Pik = 


r 

FiF — 1 )' 


_ I 

Pljk ~ p(p —i)(p — 2 )' 


Toutes les p t sont égales; comme il peut y avoir p ren- 
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contres 




Pour calculer Ipta, remarquons que le nombre possible 

des doubles rencontres est ^ ^ —— • 

1.2 

P(P~0 _ ,._v_ _ 1 

1.2 pt*-2p*-—- 

De même 

-t)(|X—2) 


1.2.3 


-Pijk — 'ZPijk- 


1.2.3 


Si je promets à un joueur autant de francs que de ren¬ 
contres simples, son espérance mathématique sera i; elle 

sera s’il reçoit i fr par combinaison de 2 rencontres; 

s’il reçoit i fr par combinaison de 3 rencontres, etc. 

Quelle est la probabilité pour qu’il y ait une rencontre 
au moins? C’est ce que nous avons appelé tout à l’heure P. 


P 



le dernier terme correspond au cas de pi rencontres simul¬ 
tanées. Les termes de P sont les pi premiers termes du 
développement de 1 — e _1 , et cette série converge avec une 
rapidité extrême. L’erreur est d’autant plus petite que pi est 

plus grand, et, pour pi = 20, elle est inférieure à ^-p 

c’est-à-dire insignifiante. 

La probabilité cherchée est 1 — e -1 . 


24 . Valeurs probables. — Soit p x la probabilité pour 
qu’une certaine quantité a soit égale à a u 
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Soit p 2 la probabilité pour qu’une certaine quantité a 
soit égale à a 2 - 


Soit p n la probabilité pour qu’une certaine quantité a 
soit égale à a n . 

La valeur probable de a est, par définition, 


a l p l -+- a ïPï -\-, . cin.p,ij 

c’est l’espérance mathématique d’un joueur à qui l’on pro¬ 
mettrait une somme égale à a. 

La valeur probable de a 2 n’est nullement égale au carré 
de la valeur probable de a. Par définition, la valeur probable 
de a 2 est 2a\p t , tandis que le carré de la valeur probable 
de a est {2a tPi Y. 

Soient b la valeur probable de a 2 , c celle de a. 

On a 

b — c^—'S.pi'lalpi— {lai p (Y, 

car 2 Pi — i. 

Nons transformerons le second membre à l’aide de l’iden¬ 
tité 

2X 2 2X' 2 — (2XX')*=2(XY'— YX') 2 , 

où les Y sont des X changés d’indice. 

Nous poserons 

X = v£, 

X'= ciis/pt, 

d’où 

XX'= a tPi 

2 X 2 = 2p e , 

2X'^2af Pi , 

2XX'=2a iPi . 


et 
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Par conséquent, 

b — c 2 = 2(\Jpia/,-\fp / c — \[pk a i'fPif’ 
b — c-= 2p c p k {a k — a t y. 

pi et pu sont essentiellement positifs ; donc b —c 2 est supé¬ 
rieur à zéro et la valeur probable du carré de a est toujours 
plus grande que le carré de la valeur probable de a, sauf 
quand a k — a t , c’est-à-dire quand a ne peut prendre qu’une 
seule valeur. 

Il est clair que la valeur probable de la somme de deux 
fonctions est la somme des valeurs probables de ces deux 
fonctions. En revanche, la valeur probable du produit de 
dëux fonctions n’est pas égale en général au produit de 
leurs valeurs probables. Ce que nous venons de dire au 
sujet de la valeur probable du carré le prouve suffisam¬ 
ment. 

Soient cependant / et 9 deux fonctions indépendantes 
l’une de l’autre. 

Soient p t la probabilité que f=zf t , et q k celle que 9 = 9 *. 

Les deux fonctions étant indépendantes, la probabilité 
pour que /= /*• en même temps que 9 = w k sera p £ g k) en 
vertu du théorème des probabilités composées. La valeur 
probable du produit /9 sera alors 


’2‘PiÇkfi<?k= {Zpifi) ( 2 ^- 9 /,), 


c’est-à-dire au produit de la valeur probable de/ par celle 
de 9 . 

25. On promet à un joueur (toujours en tirant dans une 
urne contenant p. boules et sans remettre les boules dans 
l’urne) de lui donner i fr à chaque maximum, de la liste 
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que l’on obtient, en écrivant'les numéros sortis dans leur 
ordre de tirage. Quelle est l’espérance mathématique? 

Supposons qu’il y ait maximum au i e tirage; on a tiré 
trois boules a, b, c, la (t— i) e , la et la (i-h i) e et, puis¬ 
qu’il y a maximum, a < b > c. 

Il y a fil cas possibles. Sans loucher aux autres boules, je 
permute entre elles a, b, c-, six combinaisons sont possi¬ 
bles, dont deux sont favorables, a, b, c et c, b, a. 

Dans ce groupe, la probabilité pour un maximum est 

donc Or, il y a ^ de ces groupes, correspondant au i e ti¬ 
rage, mais, pour ce tirage, l’espérance mathématique 
est|. 

L’espérance mathématique totale sera la somme des 
espérances mathématiques partielles ; d’autre part, sauf 
conventions spéciales que je ne suppose pas, ni le premier, 
ni le dernier tirage ne peuvent donner lieu à paiement. 

L’espérance mathématique totale est donc —• 

26. Soient n joueurs qui ont chacun un dé et mettent 
chacun i fr comme enjeu : celui qui amènera le point le plus 
fort ramassera les «francs; etsi plusieurs joueurs obtiennent 
le même point, plus fort que celui de tous les autres, ils se 
partageront l’enjeu. 

Le premier joueur, A, amène le point K : quelle est, à ce 
moment, son espérance mathématique? 

La probabilité pour qu’un autre joueur déterminé amène 

le point K est pour qu’il amène un point plus petit que K, 

K—i 

6 * 
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Quelle est la probabilité pour que A partage l’enjeu avec 
i — i joueurs déterminés? Ces i — i joueurs doivent amener 
le point K, les n — i autres un point inférieur à K. La pro¬ 
babilité cherchée est donc une probabilité composée, le 

produit de par • 

Ainsi la probabilité pour que A partage avec i — i joueurs 
(K i) re—£ 

déterminés est-—-On peutformer autant de groupes 


de i — i joueurs qu’il y a de combinaisons den — i lettres 

, . {n — r)I 

l— I à l— I, soit - r-r- 

(i— J )! (« — «)! 

Chacune de ces combinaisons donne à A la probabilité 
ci-dessus, et le gain correspondant est j,- l’espérance ma¬ 


thématique de A est 


(n — i)I (K — i ) K—1( n n! (K — i) a ~ e 

(i — i)l (n — i)l 6“~ 1 i il (n — i)I 6 n—1 


Il faut faire la somme de ces espérances mathématiques 
depuis i=i jusqu’à i=n, ce dernier cas étant celui où 
l’enjeu est partagé également par tous. Or 


2 


ni 

il ( n — i) ! 


(K —r)«- £ 

6«-i 


est le développement du binôme 

[r + (K-.)]« 

6 «-i 5 

( _j y* 

à part le terme qui correspond à i— o, soit - - — 

L’espérance mathématique est donc 


K>— (K —i)' 1 
6 re_1 


P. 


6 
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27. Paradoxe de Saint-Pétersbourg. — La théorie de 
l’espérance mathématique a donné lieu à ce paradoxe célèbre. 
Paul lance une pièce de monnaie; si elle retombe pile, il 
paie i fr à Pierre et la partie est terminée; si elle retombe 
face, on recommence. Si au deuxième coup on amène pile, 
Pierre reçoit a fr et la partie est terminée; si l’on amène face, 
on recommence. Au troisième coup, Pierre recevra 4 fr , ou 
bien la partie continuera, et ainsi de suite. Si la pièce pré¬ 
sente face n fois de suite et que le (n 4 - i) e coup soit pile, 
Paul paie 2 re francs. 

Quelle somme doit donner Pierre à Paul au commence¬ 
ment de la partie pour que le jeu soit équitable ? En d’au¬ 
tres termes, quelle est l’espérance mathématique de 
Pierre ? 


La probabilité d’amener pile au premier coup est-; l’es¬ 
pérance correspondante est-i- 

La probabilité d’amener face au premier coup, puis pile 
au second, événements indépendants, est une probabilité 

composée, y- L’espérance mathématique est y x 2 = -• 
4 42 

Au troisième coup, cette espérance est i x 4 = -• 

O 2 

. I I 

Au 71 e coup, —;- X 1 n — — 


Tous les termes de la série sont égaux à l’espérance 

mathématique de Pierre est infinie : il n’achèterait jamais 
trop cher le droit de jouer. 

On a voulu expliquer ce paradoxe de plusieurs manières. 
Paul n’est pas infiniment riche, a-t-on dit : sa fortune est 
comprise, par exemple, entre 2 ? et 2 P+ 1 ; si l’on amène pile 
au (/? H— i) e coup, il devra ip francs et pourra payer; mais, si 



l'espérance mathématique. 67 

l’on amène pile au coup suivant, il devra 2? +1 francs, et 
sera insolvable. Pierre ne peut donc toucher que if francs ; 
son espérance mathématique devient 


1 

2 




x 4 +...+ 


1 

2P+ 1 




1 

2P+ 2 


iP-’r 


1 

2 P +s 


2P-h.... 


La série devient 


1 

2 


1 iii 

”1-- ■ ”i--J— -7 "H q" -J—• 

2 2 4 ° 


„ I , I 

p -+-1 termes sont égaux a -> le reste a pour somme 
l’espérance mathématique est 

A* -HJ £ p -H 2 

2 2 2 


Si la fortune de Paul est, par exemple, d’un milliard, on 
pourra faire p= 3 o, et l’espérance mathématique de Pierre 
32 

sera — = 16. On voit qu’elle se réduit considérablement: 

2 

On a dit aussi que le plaisir de gagner 1 ooo fr est plus 
grand pour celui qui n’a rien que pour le millionnaire; que 
le plaisir de doubler sa fortune est indépendant de cette 
fortune. 

Le plaisir, quand on possède une fortune æ, de gagner 
une somme h, sera mesuré par 


log 


x h 
x 


On a remplacé l’espérance mathématique par l’espérance 
morale. 

pu étant la probabilité de réaliser un gain h, l’espérance 
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morale sera 


ou 


^/J°i 


x 4 - h 


x 


I, X-\-l I, JT-l-2 i, x -1-2'* 

_10g__ + ^log-^- 4-. • T^log- 


X 


pour le paradoxe de Saint-Pétersbourg. 

Cette série est manifestement convergente. 


28 . Ruine d’un joueur. — Deux joueurs, dont J’un, A, 
possède in francs, et l’autre, B, n francs, jouent à i fr la 
partie et poursuivent le jeu jusqu’à ce que l’un des deux soit 
ruiné. La probabilité pour que cet événement se produise 
sera une fonction de m et n, a>(m, n), et comme la somme 
des fortunes, m-t-n=s, est une constanle, © sera fonction 
de s et n, c’est-à-dire de n. Appelons cp(/i) la probabilité 
pour que B finisse par être ruiné : nous supposerons ici 
que les conditions ne sont pas équitables. 

Si A, à chaque partie, a la probabilité p de gagner, B a 
la probabilité r — p. 

On joue une partie nouvelle. Deux hypothèses se pré¬ 
sentent : A va gagner elB aura (n — i) fr ; B gagnera et aura 
(»-*- i) tr - 

® ( n ) comprendra donc la probabilité pour que B perde 
cette partie et finisse par être ruiné, soit p <p(/i— i), et 
aussi la probabilité pour que B,- gagnant cette même partie, 
finisse également par être ruiné, soit (i — p) 9 (n-t- 1). 

(1) ?(«) =p ?(« — O + (i—p) <p(« + i). 

Cette relation de récurrence servira à déterminer 9 (n). 
Il faut, en outre, connaître les conditions limites. 



l’espérance mathématique. 69 

Si n = 0, B serait déjà ruiné ; si n = s, m = 0, A n’aurait 
rien. Donc 9 (0) = 1, 9 (s) =0. 

29 . Résolvons l’équation de récurrence plus générale 

—i) _ t _ ----l-A 1 9(/n-i)-i-Ao9(w)=o, 

où les A sont des coefficients constants. C’est une équation 
aux différences finies, linéaire et à coefficients constants, 
dont l’intégration rappelle celle des équations différentielles 
linéaires à-coefficients constants. 

Supposons qu’on ait trouvé K solutions 91 ( n ), tp, ( n ),..., 
9k («)> de telle sorte que 

^ A q 9 £ -(n-1-?) = 0. 

f 

Nous aurons encore une solution en posant 


9 («) = «! 9,(71) 4- ce 2 92 (n) +-.. .-1- < x K cp K (/ i ). 


En effet, multiplions le 2 précédent par cc £ , et faisons la 
somme des termes obtenus en faisant varier t. 

" h ~2 A? 2 a< -hç) = o. 

if fi 

Si 9,, 92.9 k sont linéairement indépendants, on aura 

ainsi la solution générale. Supposons, en effet, que ce ne 
soit pas la solution générale; alors 


9(71) = «191-1- a 2 ?*-)-• • .-t- «^k-H^. 


Je vais choisir a t , <x 2 ,.... a K de façon à satisfaire au sys- 
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tème suivant 

tp(o) = ai9!(o) -t-a 2 ?2(°) +.. .-H «k9k(o), 

<p(i) =«i<p!(i) 4 -a 2 9 2 (i) -t-...-J-a K <p K (i), 

.►.J 

<p(K — i) = a I 9 I (K — i) 4- a 2 cp 2 (K— 1 )-+-. ..-)-«k<Pk(K —')• 

Ces K équations linéaires déterminent a 1} a 2 , a K , à 
condition que leur déterminant soit différent de zéro, ce 
qui aura lieu quand <p t , <p 2 ,9 k seront linéairement indé¬ 
pendants. Dans ce cas, on aura 

'Ko)='K') = t(2)~--='!'(K-r) = 0 , 

et par suite la relation suivante 

Ak^C^-hKI-I-Ak—— i)4-...-t-A,^(7i-i-i)-i-Ao^(n) = o. 

Je fais n = o, tous les termes s’annulent sauf A K ^ (K); 
donc <}> (K) est nul. 

Si je fais n = i, i{/ (K -+-1) est nul. 

Donc i{; (n) est identiquement nul, et 9(71) se réduit à 
9,4- a 2 9 2 «k9k- Ainsi, il suffit de connaître K inté¬ 
grales particulières linéairement indépendantes pour con¬ 
naître l’intégrale générale. 

Pour trouver K intégrales linéairement indépendantes, je 
pose 9 (7i) = ( 3 B . Alors 

A K (3 n+K 4- Au-t P”-+ K - 1 4-... 4- A 0 ( 3 re = o 
ou 

Ak ( 3 k 4- Ak_i f 3 K— 1 4-.. .4- A 0 = 0, 

d’où K valeurs particulières de ( 3 , et par suite K intégrales 
particulières. 

11 se présente une exception, quand l’équation en (3 offre 
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des racines multiples, par exemple, une racine double, 
( 3 1 = j 3 2 ; en faisant varier les coefficients d’une manière 
continue, il peut arriver, en effet, que deuxracines deviennent 
égales. On n’a plus alors K solutions. 

_g 71 

fa et fa sont des solutions; ^-« est une combinaison 

pi —P 2 

linéaire, et, par conséquent, une solution. Quand fa tend vers 
fa, par raison de continuité, on a encore à la limite une 
solution. Cette limite s’obtient en différentiant, par rapport 

71 S 71 " -1 

à ( 3 , les deux termes du rapport, ce qui donne —y—; 

n ( 3 " _1 ou, si l’on veut, n fa est donc une nouvelle solution. 
Avec une racine triple, on aurait en outre n 1 fa, etc. 


30 . Appliquons cette règle au problème qui nous occupe, 
c’est-à-dire à l’équation (1) du paragraphe 28 . 

Faisons 9 ( n) = fa; il viendra 

fa — p[ 3 "— 1 -(- ( 1— p)fa +l , 
ou 

^=p + {l—p)fa. 


Cette équation du second degré a une racine évidente, 
(3 = 1; l’autre est ^ & : c’est cette valeur que nous appel¬ 

lerons désormais ( 3 . Les deux solutions fa et 1 donnent 
pour la valeur générale de 9 (n) 

9(71) = a fa-h b. 


Les conditions limites donnent les deux constantes arbi¬ 
traires 

\ — a-hb, 

o = afa-h b; 
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1 P s 1 


-g* 


g«_ s* 

Cetle expression devient illusoire, si l’on suppose g = î. 

Quand g= le jeu serait équitable. On cherche 

la vraie valeur de o(n) par la règle de l’Hôpilal 

, . n 3"-’ — sg 4 ' -1 s — n ni 

a>(n)— —-g—r— =-= — 

*' ' — s(i s 1 s s 

Trois cas sont à considérer : 

i° g > i. Le jeu est avantageux àA,/;>i — , 

Rs — g n 

2° g = i. Le jeu est équitable, p = i — p. 


3 ° g < i. Le jeu est avantageux à B, p < i — />, 


Rs — 3 K 

La probabilité pour que B se ruine esl^p—y-* Pour avoir 

la probabilité pour que A se ruine, on permute p et i — p; 

g se change en i et n en m. On trouve donc 
P 

g-*— g-" 1 
g- s —i ’ - 
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c’est-à-dire 


1 — { 3 " 
i — (3 S 


31 . La somme des deux probabilités 

(3*— (3« i —{3» 

( 3 -’ — r " + " r — j 3 s 

est égale à l’unité, ce qui n’était pas évident a priori. En 
effet, la probabilité pour que la partie se prolonge indéfi¬ 
niment pouvait avoir une valeur finie. 

Supposons s très grand. Quand j 3 > i, { 3 * est très grand 
et 9 {n) a le signe de j 3 s ; sa limite est i. Quand ( 3 = i, sa 
limite est encore i. Quand (3 < r, ( 3 * tend vers o à mesure 
que s augmente, et la limite de 9 (n) est ( 3 '\ 

Conclusion. — Si donc s est très grand et n fini, on a la 
certitude d’être ruiné dans un jeu équitable ou avantageux: 
à l’adversaire. Mais si le jeu est avantageux au joueur,-la 
probabilité d’être ruiné devient d’autant plus petite que sa 
fortune est plus grande. 

Un joueur de profession, un banquier, joue avec tout le 
monde, c’est-à-dire avec un adversaire infiniment riche, 
mais le jeu lui réserve des avantages. Au contraire, le ponte 
qui jouera indéfiniment est sûr d'être ruiné. 

32 . J. Bertrand a calculé le moment probable de sa 
ruine. 

Pour le banquier, ( 3 <C 1, la probabilité pour que la ban¬ 
que saute est{ 3 re ; |3 est le rapport des chances favorables au 
ponte, aux chances favorables au banquier ; supposons 

(3 =—j c’est-à-dire j 3 = t-- • 

r 20 1 20 
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n est la fortune du banquier, en prenant pour unité l’en¬ 
jeu de chaque partie; il y a un maximum pour cet enjeu, 
d’où pour n un certain maximum; soit n — 1000. 

La probabilité pour que la banque saute est 

(-=)”=[(-£) T 

ou, à peu près, e -50 , quelque chose d’extrêmement faible. 

Nous arrêterons ici l’étude des cas qui se ramènent à de 
simples problèmes d’analyse combinatoire. 



CHAPITRE IY. 

LE THÉORÈME DE BERNOULLI. 


33. Nous abordons, maintenant, les théories qui se rap¬ 
portent à la formule de Stirling, au théorème de Ber¬ 
noulli et aux probabilités des causes déduites d’épreuves 
répétées. 

Supposons que les deux événements A et B, de probabi¬ 
lités respectives p et q, soient contradictoires. A chaque 
épreuve, l’un d’eux se produit certainement, et ils ne peu¬ 
vent se produire tous deux; alors 

p-bq = i, 

la probabilité totale est égale à la certitude. 

On répète m fois l’épreuve : à chaque épreuve l’un des 
deux événements se produit. Ainsi, avec un dé, l’événe¬ 
ment A peut être l’arrivée du point 6 et l’événement B celle 
i 5 

des autres points; p et <J — g - 

A se produira un certain nombre de fois et B aussi. On 
demande la probabilité pour que A se produise a fois, et B 
m — « fois. 

On suppose que la probabilité reste la même à chaque 
épreuve. Avec le dé, la probabilité est toujours ^ pour 
amener le point 6. Au contraire, avec un jeu de 32 cartes. 
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la probabilité de tirer an roi est ^ à la première épreuve; 

/ g 

elle est ou -s- à la deuxième, suivant qu’on n’a pas amené 
3i si r 

ou qu’on a amené un roi à la première. 

34. Cherchons d’abord la probabilité pour que les évé¬ 
nements se succèdent dans un ordre déterminé 

AABAABBAB; 

les probabilités de chacun de ces événements seront 

ppqppqqpq, 

et la probabilité composée, la probabilité pour que tous ces 
événements se produisent à la fois, est 

ptq'*. 

En général, la probabilité pour qu’il se produise dans nn 
ordre déterminé « événements A et m — « événements B 
est 

pa.pm.-a . . 

Elle est indépendante de l’ordre considéré. 

35. Si l’on veut que les m, épreuves donnent, dans un 
ordre quelconque, « événements A et m — a événements B, 
en vertu du principe de la probabilité totale, la probabilité 
cherchée sera la somme d’autant de termes égaux à 
p a q m ~ a qu’il y a d’unités dans le nombre des permutations 
avec répétition de a lettres A et de m — a lettres B ; ce 
nombre est 

ml 

al (nz.— a)! 
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La probabilité pour que les événements se succèdent 
dans un ordre quelconque est 


Ug — 


a.\(m — a)! 


piqm-a. 


c’est l’un des termes du développement de {p + q) m . 

Si je fais la somme de tous les'termes que je puis obtenir 
en faisant a égal à o, à i,.... à m, j'obtiens 

La somme des probabilités de tous les cas possibles doit 
être égale à l’unité, puisqu’il est certain que l’un de ces cas 
possibles se produira, et un seul. 


36. Quelle est la plus grande de toutes ces probabilités? 
Je vais calculer le rapport d’un terme au précédent; 


il 


(a-bi)! (m 


! f m — a — 


)! 


n a-H /7m—a—1 
P V y 


u a+l _ al {m — a)l _ t _ m — a p 

(a-t-i)I {m — a— 1)!^ a 4- 1 q 


De même en changeant a en a — 1 

« a _ m — a-t-r p 

«a-1 _ « q 


Pour que. u a soit la plus grande de toutes les probabilités, 
il faut que 

M a-n Ha M a—1 • 

Donc 


c’est-à-dire 


Ha +1 


«a 


<1 


et 


Ug 

«a-i 


>1, 


■a p 


<1 


et 


m — a.- 1 -t p 


>1. 
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( m — a)p <(a + i)q et ( m — cl -I-i)/» > ccq, 

mp — a.p<CcLq-\- q et mp — ap -t- p > aq. 

Comme 

ap -+- ccq = cL(p + q) = «, 
mp < a -1- q et mp > a — p. 

De telle façon que nous arrivons aux inégalités 
mp -\-p>cL> mp — q. 

D’où une limite supérieure et une limite inférieure pour 
cl . La différence de ces deux limites est p-\-q— i ; ainsi a 
est compris entre deux nombres, généralement fraction¬ 
naires, qui diffèrent d’une unité, et, comme cl est entier, ces 
deux limites déterminent a. 

Il y a exception quand mp -t- p est entier ; alors mp — q 
l’est aussi. On pourrait hésiter pour oc; deux termes consé¬ 
cutifs dans le développement de (p-bq) m sont égaux entre 
eux. 

Si m est très grand, le rapport^ est compris entre p + 

i , cl . . , 

et p-: donc — sera voisin de p. 

m m 

C’est une forme d’établissement du théorème de Ber¬ 
noulli. 

Si je choisis a de façon que u a soit le plus grand pos 
sible, le rapport du nombre des événements A au nombre 
des événements 3 sera à peu près celui des probabilités 
p et q. 

37. Quelle est la probabilité pour que « s’éloigne d’une 
quantité donnée h de mp? Soit 


cl — mp — h. 
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J’appelle h Y écart et je vais chercher la valeur probable 
de la valeur absolue de cet écart, ainsi que la valeur pro¬ 
bable de son carré. 

Occupons-nous de la valeur probable de h , de la valeur 
probable du module [ h | de h, de la valeur probable 
de h*. 

Je vais considérer la valeur probable d’une quantité quel¬ 
conque M; c’est 2 Mm«- 

y* M «a = V M , - r-r p«-qm-a ; 

Jmi. a\(m — a)l r 2 


le second membre est un polynôme entier, homogène et de 
degré m par rapport à p et q, que je désigne par F (p, q). 
Cherchons à en déduire la valeur probable de Ma; c’est 


Ma 


m\ 


a! (m — a)! 


p a q n 


Nous avons passé d’une expression à l’autre en multi¬ 
pliant par a les termes successifs; en différentiant p a q 
par rapport à p, nous aurions eu ap“ _1 q m ~ a -, la valeur pro¬ 
bable de Ma est donc 

pd¥ 

dp 

Les nombres petq ne sont pas indépendants, puisque 
leur somme est i. On a fait la différentiation comme s’ils 
l’étaient, on a différeutié par rapport à p comme si q était 
constant. De plus, M peut dépendre de p : h dépend de p. 

J’éviterai cette confusion de la manière suivante : 

A la place de p et q, j’introduis deux variables auxiliaires, 
x et j, et je considère la fonction 

m ! 

a 1 ( m — a ) 1 


F(«, y)=M 


y/lt —CL 
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Si M dépend de p, je n’y remplace pas p et q par x et y; 
la valeur probable de M est bien alors F ( p, g), et 


Ma 


ml 


a! (m —a)! 


X* yll 


est bien x —,— 
dx 

On y remplacera x et y par p et q après la différentia¬ 
tion. 


38. Appliquons ce qui précède au problème qui nous 
occupe. 

Soit d’abord M = i ; 

F(#, y) ,7 — —x a Y m ~ a — {x r) m ; 

si je fais ensuite 

æ —p, y — q > 

il vient 

^{p,q) = {p + q) m =^ 

et, en effet, la valeur probable de i est i. 

Pour avoir la valeur probable de a, je différentie F (x, y) 
par rapport à x, et je multiplie par x, ce qui me donne 
mx(x -b y) m ~ l ; puis, je fais x = p, y = q. La valeur pro¬ 
bable de ce est mp. 

Pour avoir la valeur probable de a 2 ,’ je différentie le 
terme mx(x -by ) m_1 par rapport à x , puis je multiplie par x ; 
ce qui me donne d’abord 

m(x -\ -y) mJ ~ 1 -t- m(m — i)x(x -t-y)" 1-2 , 

puis 

mx{x -t-y )" 1-1 m(m — i)x t {x -\-y) m ~ s . 

En faisant x =p et y = q, j’obtiens, pour la valeur pro- 
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bable de a?, 

mp -t- ni*p *— mp*. 

Cherchons, maintenant, les valeurs probables de h et h*. 
La valeur probable de A sera la valeur probable de «, 
moins la valeur probable de mp, c’est-à-dire 

mp — mp — o. 

La valeur probable de l’écart est donc nulle. 

La valeur de A 2 est 

A 2 = oc 2 — 2 mpoi-\- m ï p ï % 

sa valeur probable est donc 

{mp - s r m ï p *— mp-) — imp.mp -+- m 2 p-, 
ou 

mp(i— p), 

c’est-à-dire mpq. 

La valeur probable du carré de A est mpq. 

On vérifiera en passant qu’elle est effectivement plus 
grande que le carré de la valeur probable de A, qui est 
nulle. 


39. Passons à la valeur probable du module de A; cher¬ 
chons d’abord quelle serait l’espérance mathématique d'un 
joueur à qui on promettrait une somme i si l’écart- était 
positif, et o s’il était négatif. 

doit se borner aux termes dont l’écart est positif. 
Soit «p le dernier terme de 2« a pour lequel l’écart est 
positif; on a 

(3 > mp et (3 — x < mp, 


et l’espérance mathématique de ce joueur serait 


- p m ~ 1 q- 


ml 


(31 (w —13)1 


pPq m ~P, 


P. 


7 
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c’est-à-dire F ( p, q) en posant 

y)=æ m - t- y x'^y-i-,.. ■+- ^^ xPy m ~?. 

Si l’on supposait, maintenant, qu’on ait promis à ce joueur 

, , , dF 

une somme oc, son esperance mathématique sera æ —, en 

faisant x~p,y — q après la différentiation. Enfin, la va¬ 
leur probable d’une fonction qui est égale à h pour A > o et 
à o pour h < o sera donc l’espérance mathématique de ce 
joueur à qui l’on promet « — mp quand a > mp; c’est 
donc 

dF o 
x TZ~ m P^- 


F est un polynôme homogène et de degré m eux et y; 
donc 

„ dF dF 

mV = x d^+r-dï' 

L’espérance mathématique ci-dessus devient 


dF 

dx 


dF 

dx 


dF 

dy' 


ou 


dF 


dF 


æ ^-ypw 


en faisant x =p, y — q, après différentiation. Ou a d’abord 

/dF dF\ 

p *\dZ-7Çp 

d’autre part 

/7Ï ^ 

—=mx^-i-m{m—i)x>n-*y-i-...-{- pfyài-pfl 


dx 

dF 


— = mx m — l -+-m(m — i)x m ~ : y -h.... 
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II entre un terme de plus dans la somme qui représente 

dF ... , , dF dF ...... , 

ce dernier terme représente —-^s et il est égal a 


; æPr m -P-, 

** /y» 


(3! (m —(3)! ' *' x 

et, après qu’on y a fait x~p,y = q, il devient 

_^_ nfip—pâ. 

(3!(/« —(3 )\ p q p 

Pour l’espérance mathématique de notre joueur, nous 
avons donc 


nu 


pn -*_ nP q ltt— P — ~ _ 

^(3 \{m — (3)l” ? p p ! {m — [3)1 




On y reconnaît le produit par $q, du terme «p, le dernier 
qui corresponde à un écart positif. 


40. On promet à un joueur une somme égale à la valeur 
absolue de l’écart : soitE son espérance mathématique, en 
admettant qu’il ne doive être payé que si l’écart est po¬ 
sitif, E' en admettant qu’il ne doive être payé que s’il est 
négatif. 

La valeur probable de h est E — E'. 

Gomme la valeur probable de h est nulle 

E —E'=o, 


et la valeur probable de | h | est 2 E. 

41. Ainsi la valeur probable de l’écart h, considéré en 
valeur relative, est zéro; la valeur probable de h? est mpq\ 
celle de | h | est 2 E ou 


2 ^ p! C r-ip)! ^ m ~ p - 
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jb correspond au dernier terme pour lequel l’écart est 
positif, et il diffère peu de mp. 

A cette expression on peut substituer la valeur appro¬ 
chée 

Ce terme est beaucoup plus grand que tous les autres, 
mais il est très petit d’une manière absolue. 

La valeur probable de | h | est beaucoup plus petite que 
mpq. Suivant une remarque déjà faite, le carré de la valeur 
probable de | h | est plus petit que la valeur probable de 
h 1 : donc la valeur probable de | h | est certainement plus 


petite que \Jmpq. 



CHAPITRE Y. 


APPLICATION DE LA FORMULE DE STIRLING. 


42. Je vais montrer comment on peut connaître une 
valeur approchée de u a , du terme maximum, de la valeur 
probable de | h | , etc. 

Le calcul de ces valeurs approchées se rattache à la for¬ 
mule de Stirling. 

On a 

n\—j x n e*”-dx— T (n -h i), 
do 

c’est-à-dire la fonction eulérienne; cette intégrale conserve 
un sens quand n est positif, mais non entier. Si l’on pose 

-t-1 ) = n a e~ n \j2Ttn, 

le rapport du premier membre au second tend vers l’unité 
quand n augmente indéfiniment. 

Je ne donnerai pas la démonstration générale, mais seu¬ 
lement celle qui concerne n entier. 

La formule de Stirling sert à calculer la factorielle d’un 
nombre entier 

ni — n n e~ n \/ 2 Ttn ; 

c’est une formule asymptotique. L’erreur absolue que. l’on 
commet en prenant lé second membre comme valeur du 



86 


CHAPITRE V. 


premier augmente indéfiniment avec n, mais l’erreur rela¬ 
tive tend vers zéro. 

Il en résulte que l’erreur absolue sur le logarithme de n ! 
tend vers zéro. 

Je puis d’abord écrire 

«! = n’ l e~ n \/ nF {n), 

et je vais démontrer que F (n) tend vers une limite finie et 
déterminée C quand n augmente indéfiniment; de telle 
sorte que l’on aura alors 

ni = C n a e- n \fn. 


43. Considérons le produit 

F(a)F(3) F(in-i) 

F(i)F(a)"' F(«) 

Ce produit infini est convergent, ou, ce qui revient au 
même, la série, dont le terme général est 


est convergente. 
Nous avons 


log 


F(n-hi) 

F(re) 


(/i-bi)! — (/i-t-i) ra+1 e —(n+I )\Ar+TF(rt -t- 1 ), 

F(re-t-i)_(re-t-i)! n n e~ a \fn 

F(«) ni (« -t- 1 ) n+l e~ < ‘ n+ ^\/n 4-1 


F(#H-i) 
F(«) = 

log 


_ 71-+- I 

(/I -(- j ) 71 -*- 1 

F(re-t- j)_ 

F(«) _I 



Le second membre se transforme, à l’aide du dévelop- 
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pement de Iog(i æ) en série, en 

V 2 / \n 2 ns 6n* 


«7 


ou en 


1 1 

I — 1 H-9—r 

2 Tl ànr 


-r 7 —- —•. • , 

2 n 4 «- 


c’est-à-dire en 


- j -H- .. » 

12 n- 


Si j’appelle u n le premier terme de cette dernière série, 


et 


«n 


I 

1271 * 


lim n-u Jl = — 


1 

12 


En vertu d’une règle de Gauss, cette série est conver¬ 
gente. 


44. Reste à calculer la valeur de C. 
Rappelons la formule de Wallis 

tc 2244 2 n 2 n 

2 t 3 3 5 2 n — 12 /i-t-i 5 


on en déduit, pour n plus grand que toute quantité donnée. 



2.4...2 n 


1.3.. .(2rt — 1) \J2T1 + 1 


A.u numérateur figurent les n premiers nombres pairs, 
au dénominateur les n premiers nombres impairs; je 
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tiplie haut et bas par 2.4...2/1; il vient 

(2.4... 2«) 2 2 2 "(«!) 2 

(2/1)! \/in -1-1 (2/1)! \Jni -1-1 


Cette fraction a pour limite 



quand n augmente in¬ 


définiment. Si nous y remplaçons les factorielles par leur 
valeur approchée pour x très grand, elle devient 


ou 


2‘“n !n e-* n C i n 


(2 n) 2 n e~ 2 n 2n\/2 fi -f-1 


y 2/1(2/14-1)’ 


et, quand n grandit indéfiniment, elle se réduit à -• 

Cette limite étant la même que la précédente, 
on a 

C = 



45 . Valeur asymptotique de u a . — Quand deux événe¬ 
ments contraires, A et B, ont pour probabilité respective p 
et q, de telle sorte que p-\-q—i, nous avons vu que, sur m 
événements, la probabilité pour qu’il s’en produise a égaux 
à A et m — « égaux à B est 


m\ 


al (m — a)! 


p a q'n— a . 


Calculons une valeur approchée de u a , en supposant m, 
très grand, et de plus 

a = mp 4- 1 \fm, 
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X \Jm est très grand quand m est très grand, mais nous 
supposerons X fini et, par conséquent, l’erreur relative très 
petite, quand on prend mp pour valeur de a, c’est-à-dire 


— voisin de 1, 

mp 


On a comme conséquence 


p\fm 


puisque 


m — a = mq — X \fm. 


p-i-q = i. 


Je remplace dans u a chaque factorielle par sa valeur cal¬ 
culée à l’aide de la formule de Stirling, 

m m e -m \J2%m p a q m ~ a 

&a— 1 >...... j- .. ...... ■ . 9 

« a e~“ y 27 ta ( m — a ) m ~“ e -un-ct) y 2 tc ( m — a) 

_ m m p a q m ~ a ! m 

a“(m— a) m_a y 2ira(m— a) 


En réunissant les termes qui ont pour exposant « et ceux 
qui ont pour exposaut m — oc, 


-=(?)*GSr)“ 


2ira(m — a) 


<x{m — a) (m/3 -+- X \fîn) {mq — X \fm) 


a , m — a . , . 

— tend vers Funite ainsi que-: le radical qui entre 

mp mq ^ 



9 » 

dans u a a pour limite 


chapitre v. 


Vi 


2‘Km/i mq 
Nous pouvons écrire 


ou 


\/2 izmpq 


log« a = log 1 = — a log-^- — (m — a) log * 

S/zTzmpq m 9. 


ou 


log «g—log f — (mp 4 -l\Jm ) log f 1 4- 

\j2%mpq \ ps/mj 

— (mq — X \fm) logf i-—''j ■ 

V <7VW 


Pour m très grand, nous pouvons développer les loga 
rithmes de i 


et de x-par la formule qui 


p\J m q\fm 

donne le développement de log(r 4-#). Ainsi, 


(mp 4 - X \fïn) log ( 14- 


• v —/ I ' i ,— 

\ P v m J 


devient 


( mp 4 - X \J~m) 


1 - 


X 3 


psfïk 2 p'-m 3 p 3 m \fm 


-O- 


Je cherche, en ce moment, une valeur asymptotique de « a , 
c’est-à-dire une valeur telle que le rapport de u a à cette 
valeur tende vers i quand m augmente indéfiniment; je 
pourrai donc, dans le produit précédent, négliger tous les 
termes qui tendent vers o, ceux qui contiennent m ou \jm au 
dénominateur. 

Il restera 
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J’en déduirai la valeur du produit 



q\jmj 


en changeant dans le résultat précédent X en —X et p en <7; 
et la somme de ces produits sera, en définitive, 


ou 


Ainsi 


V_ 

2 


\\fm- 


V_ 

ip 


(— X\A 


Tq 



c’est-à-dire 


JL. 

zpq’ 


lo gu a = log 1 . . 

\J2izmpq 


X* 

ipq 


En repassant des logarithmes aux nombres, on aura 
comme valeur approchée de u a 


u a = 


x* 

e s P‘f 
\f2nmpq 


Lorsque m croît indéfiniment, le rapport de « a à l’expres¬ 
sion précédente tend vers l’unité. 


46 . J’observe d’abord ce qui se passe pour le terme maxi¬ 
mum. 

Le maximum de u a s’obtient en donnant à <x une valeur 
qui diffère très peu de mp ; alors X est nul, et la valeur du 
1 

terme maximum est - ..- • 

\J2nmpq 

Cette expression diminue avec m. Il ne faut pas croire 
que, si m augmente indéfiniment, la probabilité attendue 
s’approche de la certitude; au contraire, elle tend vers zéro. 
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C’est là le théorème de Bernoulli, que nous préciserons 
tout à l’heure. 


47 . Quelle est la probabilité pour que X soit compris entre 
X et X 4— g ÏX? 

Je considère dl comme très petit; dk \fm est cependant 
un nombre entier, ce qui veut dire que dk est de l’ordre 



Si je donne à X un accroissement très petit, l’exponentielle 
ne changera pas, u a sera sensiblement constant. 

La probabilité cherchée est une somme de termes tels 
que « varie de a à a 4- k, a et a 4- k étant définis par 

a = mp -t- X \fm, 

« -|— k “ mp (X 4 " dl ) \J iïl, 


c’est-à-dire que 

k — dl \fm. 

« doit être compris entre les limites 

X + rfX> ? - ~"*ff >X, 

\fm 

c’est-à-dire qu’il doit être égal à l’un des nombres 
«4-i, «4-2, ..., «4 - k. 

La probabilité totale est 

u a-t-l 4- M a+ j 4-... 4- «a-i-A* 

11 y a là k termes sensiblement égaux à u a ; la probabilité 
cherchée est 

_ 

ke *po 


\J%nmpq 
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ou, en remplaçant k par dX \[m. 


à» 

dke 2 p<I 

\/2TZpq 


48 . Nous sommes donc ramenés à considérer, en posant 


l’expression suivante 


h 0 - — 


1 

T£q 


h dx e~ h ~ x ' 
\pK 


Elle représente la probabilité pour qu’une quantité x soit 
comprise entre x etx-\-dx; pour qu’elle soit comprise 
entre x 0 et x u la probabilité deviendra 



hdxe-h '* 1 


</ït 


pour qu’elle varie de — 00 à -4- 00, 


jC 




00 


hdxe- 1 **' 

\Ztt 


En posant hx—y, cette dernière intégrale se transforme 
en 


L 




00 


dy e — •>'’ 

\/u 


C’est une intégrale connue, dont la valeur est 1. 


49 . Arrêtons-nous sur quelques conséquences dececalcul. 
La probabilité pour que X soit comprise entre — 00 et 
-H 00 est 1, ce qui paraît une tautologie. Cette conclusion 
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n’était pas si sûre : la formule dont nous nous sommes servis 
était approchée, et vraie seulement si X est petit par rapport 
à \[m. 

Soit d’abord _ 

a = mp -t- X \Jm ; 

la probabilité pour que X soit compris entre X 0 et \ tendra, 
d’après ce qui précède, vers 

-X, -2L 

! die *pq 

*''•0 \Jnzpq 

quand m croîtra indéfiniment. D’autre part, quand X„ etX t 
s’éloignent indéfiniment, l’intégrale tend vers l’unité. 
Posons maintenant 


et 


«> mp{i — s), 
a < mp{ i -t-e). 


Soit F (e, m) la probabilité pour qu’il en soit ainsi. Je dis 
que je puis prendre m assez grand, s étant donné, pour que 
la différence 

i — F (s, m ) 


soit plus petite qu’une quantité donnée ï). Choisissons 
d’abord un nombre X assez grand pour que la différence 


x 



dl - 
— e 
\/nzpq 


ïpq 


Y] 

soit plus petite que — • Cela est possible puisque l’intégrale 

tend vers i, quandX augmente indéfiniment. Une fois X choisi, 
je prendrai m assez grand, 
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i° Pour que 


\<Zsp</rn, 


F(e, w)>F( — m). 


' 1 \ 
—P=> m )• 

p\ ,m r 


2 0 Pour que la différence 


F f-ï—,m)-f dl r = e <H; 
\PV m J \Jntpq 2 


cela est possible, car, pour 1 donné, la limite de la proba¬ 
bilité 


P< 

\p\jm ) 

est représentée par l’intégrale J" 


pour m — oa 


On aura alors 


i—F(s, m)<-,n. 


En résumé, la probabilité pour que a soit compris entre 
mp (j — s) et mp (i -t-e), quelque petit que soit s, tend vers 
l’unité quand m augmente indéfiniment. 


50 . On peut se demander quelle est la valeur probable de 
x n ; ce sera par définition 

r +a ha^dat 

Si n est impair, cette intégrale est nulle. 

Si n est pair, elle vaut 



hx n dx c _ /t , TÎ 
y/ir 
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Nous avons cherché la valeur probable de l’écart en 
valeur absolue; cherchons la valeur probable de la valeur 
absolue de æ n , j æ n |. C’est 


L 


h\x n \dx ^ 
v/tt 


La fonction sous le 
donc 


signe J est paire ; cette intégrale vaut 
hx a dx 


■/ 

j 0 


V/tt 




51 . Ainsi, dans tous les cas, nous sommes ramenés à celte 
intégrale, qui se ramène elle-même aux intégrales eulé- 
riennes. 

Posons 

h- af-—Y, 

d’où 

_ i 

h dx = — v 2 dy. 

2 ‘ J 


L’intégrale ci-dessus devient 


d o 2 h n v/ïr 


1 n 
2 




ou 


' y TT J o 


h" \Ztï 

C’est l’intégrale eulérienne 


n —1 

“ e~r. 


l 

2 
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Si « est pair et égal à 2 [*, 

ri r i = r G +f ‘) =r (ï) 

et, comme 

r(i) = v Æ, 


1 3 

2 2 



la valeur probable de | æ ' 1 | est 

1 i. 3 ...(2p. — 1) 
P 2Ï 1 


Si « est impair et égal à 2/2. -+-1, la valeur probable de 
I æ n I est 

r(fA-+-0 

ou 

/i B \/7t 

Faisons n =0; la valeur probablede |i| est égale à 1. 
Faisons n = 2 ; la valeur probable de | x 1 1 est 

1 

2 h? 


Nous avons cherché la valeur probable de (a — mp )* et 
nous avons trouvé mpgr. Ici, nous cherchons la valeur pro¬ 
bable de X*, c’est-à-dire du carré de 


a — m p. 

ÿ—— j 
y m 

ce doit être 

Cela se vérifie sans peine, puisque 


h- 


r 

w’ 


P. 


8 
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La valeur probable de | æ | est 


r 



Nous avons cherché la valeur probable de | a — mp | ; 
c’est le produit par 2 mpq du terme maximum de 2« a , 
impqu a , où a diffère très peu de mp. 

Pour calculer ce terme maximum, il suffit de faire X —o; 
on trouve 

r 

s/zmnpq 

Donc, la valeur probable de | a — mp | est 

2 mpq 
• 1 

sfzTtmpq 

c’est-à-dire 

\J2mpq 

v/tt 

On en déduira la valeur probable de|X|en divisant par \/m; 
on trouve 



52 . Nous avons cherché la valeur asymptotique, pour m 
très grand, du terme 


a! (m — a)! 


p a q m ~ a , 


en supposant a = mp -+- X \Jm. 

Cette valeur asymptotique de u a est 

_ 

e i P<i 


\ji%mpq 
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Cherchons, maintenant, la valeur asymptotique de « a 
pour a = me. 

On trouve, en comparant les deux expressions de a, 

X = (e — p) s/m. 


On pourrait donc être tenté de croire que la valeur asymp¬ 
totique est 

m(e—pl» 

e 2 w 
V/27 xmpq ’ 


mais cette expression est inexacte. 
La valeur exacte de « a est 


al {m — a) ! 




Si m et a sont très grands, l’expression asymptotique de 
«a est 


m tn e -m y/ 2 7I7W 


x. a e~ a y/27 :a(m — cc)" l ~ a s/-2.it{m — a) 


p a q m ~ a . 


Le rapport de ces deux expressions de u a tend vers l’unité, 
toutes les fois que m et m — a augmentent indéfiniment, 
et qu’on a 

a — em. 


e tendant vers une valeur finie. 

Je vais simplifier l’expression asymptotique de u x 

m " 1 / m „ _ 

a a (m — a) m ~ a y zTca{m — a) r ' 

Soit a = em; je pose 


m — a = e' m, 


d’où 


s — 1 — e. 
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L’expression asymptotique devient 


( ni£) ms (ms 1 
et, comme m m = m me x m' nZ ' t 


_i / 1 n mE n m.Sr' 

V 2 TT me£ ,y d ’ 


Soit 


alors 


/ mp\ ms / mq\ ,nsr / i 
\msJ \mg') y 27 r/»ee' 

*=(?)’(?)' 


«a = 


v /2 7i mee' 


53. Je dis que A est toujours plus petit que r. 
s, e' restant constants, je fais varier p et q, en les laissant 
liés par la relation 

p-\-q = l. 

Quel est le maximum de A? 

Ce maximum a lieu quand p E q £ ' est maximum, c’est-à-dire 
quand p et q sont proportionnels à leurs exposants : 

P 9 P ■+■ 9 
s e' e -+- e' 


Ainsi le maximum sera atteint quand 


et alors 


p = s, p = s!, 
A — i. 


Le raisonnement suivant nous fera d’ailleurs mieux con¬ 
naître les variations de A. 


54. Je vais supposer p et q constants et faire varier s et e'. 
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Pour cela, je considère 

lo gj = e lo g^ + £' lo g^' 

Comment varie ce nombre? Je prends sa différentielle 
totale 

£ £' 

de log —h de' log —f Æ + de' ; 

p q 

elle doit s’annuler pour qu’il y ait maximum. Mais e, e' ne 
sont pas indépendants. On a 

de -+- de'= o. 

Donc 



_e__ s + s' _ 

p~ q ~~ p-+-q ~ 

Le maximum sera atteint pour 

e—P, d — q, 

et ce maximum sera égal à L’unité. 

Comment variera Â? Je fais e = o, A. est égal à q', je fais 
e = r, A est égal à p. 

À part de q, croît jusqu’à i pour e=p, puis décroît 
jusqu’à p. 


55. La formule qui donne une valeur approchée de n 1 est 
»! = nPe— n \/«F (k). 

F (k) tend vers une limite, y/âïr, quand « augmente indé¬ 
finiment, 

(« -f- 1 )! = (« -+- i) n+1 e -( " +1) y/«-+-iF(«-t-i). 
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On en tire 


F(k + i) 

' F(») 


log 


F(k + i) 
F(») 


{ n \ n /« 

= (- et/-, 

\n H— r y y n -4- i 


Il s’agit de savoir si F («) va en croissant ou en décrois¬ 
sant avec n, c’est-à-dire si le logarithme du premier membre 
est positif ou négatif. 

Je divise le second membre par il reste 


i 


1 

« -i— 

2 



Je pose k=— et je considère la fonction 


c’est-à-dire 


<p(aO= y " ■ — — îog(i-t-æ), 

- [ - 

X 2 


? ^ =—log (l+ æ ^‘ 


<p (n) est-il positif ou négatif? x varie de o à i. 
Pour x=o, 

<p(o) = o; 

pour x — i, 

2 


<p(i) = 3 —log2. 


Comme log2 = 0,69..<p(i) est négatif. 
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Il faut voir si la dérivée s’annule; 


co'(x) = 


. 2(.t;+2) — ix i 

* ( » ) = (« + ,)< - 

4 _i__ 4 (æ + O — (x-i- 2)* 

(ar + 2) 2 x-i~i (®+i)(* + 2) ! 


Le dénominateur est toujours positif; le numérateur est 
égal à — x 1 . Donc <p r («) est toujours négatif, par consé¬ 
quent <p (x) décroît; donc elle reste négative et 

F(k-i-i) <F(k). 


et l’on a 


c’est-à-dire 


On a aussi 


n = 1, ni = 1, 


1 — e_I F(i), 
F(i) = e. 
F(oo )=z\Jv‘K. 


F (n) va toujours en décroissant, mais la décroissance 
n’est pas très grande, car 

0 = 2,8... et \/ 27 T = 2, 5 .... 

36 . Écrivons la valeur de u a , 


M “ a“(»z — a }m—ctP 9 


« g —«*/ _ 

* V a(m — a) F(a)F(»z — a) 


II s’agit de trouver une limite supérieure de cette expres¬ 
sion. D’abord 

F(wî) < F(/7i — a), 


F(a)F(ira— a) F(a) 


donc 
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I04 

Or ~ —■ est lui-même plus petit que—Lr; la valeur asymp- 
* y27r 

totique de u a est en même temps une Limite supérieure. 

57 . Quelle est la probabilité pour que « soit plus petit 
que em? 

Cette probabilité, II, est 

Il — U 0 -f- U-i -t-. . . -f- ffp, 

avec 

fi <zsm, fi-b-item. 

Je suppose 

£<p. 

Je vais d’abord écrire 


fi +i = Em; 

u 0 , u u ..., ftp vont en croissant. 

H < «p H _i(P -t-i). 

Nous avons une limite supérieure de «pn-i; si donc 
fi -t-i = em, 

n < _A™£7 w_, 


^zizmee' 


ou 


Soit maintenant 
Alors 


„ A” 1 \Jem 

Il < — — 

\/2TO' 

fi +1 > em. 

n<«p.(|3-l-i). 


11 s’agit de trouver une limite supérieure de «p; je pose 



application de la formule de Stirling. 


io5 


Si — était égal à e, on aurait 
m ° 


u a < 


mVï 


2 TT j 3 ( m — P) 

Or, A est une fonction de e qui va en croissant avec e, 
jusqu’à z—p, et<p(e)><p^^. 

Comme il s’agit d’avoir une limite supérieure, 

«p<A y/ 27 C p( ?w _JJ)’ 

D’ailleurs (3 est supérieur à zm — i, 

| 3 >em— r, m—| 3 >e f m— r. 


Donc 


u » <km vïz 


(zm — i) (s'm — r j 


Pour en revenir à H, inférieur à «g ((3 4-1), nous remar¬ 
querons que (3 - 4 -1 est lui-même inférieur à zm -+-1 ; et nous 
arriverons finalement à une formule un peu plus compliquée 
que pour zm entier : 

em entier, II<A" t 



zm non entier, 


n<A' 


■»/= 

V 2 TT 


(em -1- i) 2 m 


(zm — i ) (e'm —i) 


Ainsi : 

La probabilité pour que a soit plus petit que em, si e est 
plus petit que p, est toujours inférieure à l’une ou l’autre 
quantité que nous venons de calculer ci-dessus. 

Celte probabilité tend vers zéro quand m croît indéfini- 
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ment, pourvu que s<Lp- C’est le théorème de Bernoulli, 
qui peut s’énoncer encore ainsi : 

La probabilité pour que a soit compris entre mp{ r— 8 ) 
et mp(i-\- 8 ) tend vers l’unité quand, 8 restant constant, 
m croît indéfiniment. 
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58 . Nous avons posé 

a = mp 


et nous avons cherché la probabilité pour que X soit compris 
entre deux limites X„ etX t ; cette probabilité est représentée 
pour m très grand par l’intégrale suivante : 



i 

zitpq 


e 


2 W dk. 


Nous avons été conduits ainsi à rechercher ce qui se passe 
lorsque la probabilité, pour que x soit compris entre x 0 et 
x u est représentée par l’intégrale 

C Xl h 

f —=e~ !,,x 'dx. 

* 4 „ 

Je dirai, pour abréger, que la loi de probabilité est 
normale, lorsque la valeur de la probabilité est représentée 
par celte intégrale. 

Je supposé que x soit positif; la probabilité devient 

f 

J 0 

c’est-à-dire-* 


jLe-h'x’dx, 
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Si je considère 

r r ° h 

/ JL e - h '*' dx. 

J 0 \/tc 

cetle intégrale ira constamment en croissant quand x 0 
augmente de o à -+- », puisque tous ses éléments sont posi¬ 
tifs. Elle atteint en particulier la valeur ÿ • 

4 

La quantité x 0 pour laquelle elle est égale à i est ce qu’on 

appelle l 'écart probable. La probabilité est la même pour 
que | x [ atteigne ou n’atteigne pas celte valeur. 

x 0 est proportionnel à -j-j et les Tables calculées pour cetle 

intégrale permettent d’en trouver la valeur. 

Soit x une quantité dont la loi de probabilité est normale. 
La valeur probable de x est 

i 

h\fË 

La valeur probable de x * est 

T 

2 h 2 

La loi de probabilité de ax est encore normale. 

Posons <xx = æ'; la loi de probabilité de x' est 




et il suffit de poser 
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La valeur probable du carré de a« est 

<x- 
2 A 2 

59 . Supposons que la probabilité pour que «soit compris 
entre x 0 et soit exprimée par l’inlégrale 

r Xi h 

/ «te, 

« 4 . vrc 

et que la probabilité pour que y soit comprise entre y 0 et ^ 
soit exprimée par l’intégrale 



Supposons en outre que ces deux quantités soientindépen- 
dantes, ce qui peut se traduire par les termes suivants : là 
probabilité pour que la première soit comprise entre x 0 et 
«! est indépendante de la probabilité pour que la seconde 
soit comprise entre y a et y t . 

La valeur probable de x 2 est - 4 -r, celle de y 2 est— 

2 A 2 J 2 A' 2 

Quelle est la probabilité pour que le point, dont les coor¬ 
données seraient x et y, soit compris à l’intérieur d’une aire 
donnée? 

Occupons-nous d’abord d’une aire rectangulaire. 

La probabilité pour que le point x, y tombe à l’intérieur 
du rectangle, c’est-à-dire pour que les deux systèmes 
d’inégalités 

«0 « < 'C «1 ? 

soient satisfaits à la fois, est représentée par la double 



Ito 


CHAPITRE VI. 


intégrale suivante, étendue à tout le rectangle 



e —/ i'V dx dy. 


Si l’aire est quelconque, je la découpe en rectangles infi¬ 
niment petits. La probabilité totale sera la somme des inté¬ 
grales doubles relatives à ces rectangles élémentaires; ce 
sera, en définitive, l’intégrale double étendue à tous les élé¬ 
ments de l’aire. 


60 . Supposons maintenant que l’on ail 
x-^-y — z. 


La probabilité pour que z soit compris entre z et z-^-dz 

est celle pour que le point 
(x, y) soit compris entre deux 
droites parallèles infiniment 
voisines; la probabilité cher¬ 
chée sera celle qui est rela¬ 
tive à cette aire infiniment 
petite. 

Je vais décomposer cette 
aire infiniment petite en élé¬ 
ments. 

Pour cela je partage l’axe 

des æ en une infinité d’éléments, et par les points ^ 
de division je mène des parallèles à l’axe des y; 
j’obtiens ainsi une infinité de petits parallélo¬ 
grammes : quelle est l’aire de l’un d’eux, ABCD ? . t 

Les points A et B sont sur la droite J 

Fig. 2 . 



æ + yz=z; 
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les coordonnées de A sont x et z — x, celles de B, x + dx 
et s — x — dx. 

Les points C et D sont sur la droite 
x - y— z + dz; 

les coordonnées de D sont 

x et z -t- dz — x; 

celles de C 


x -t- dx et z 4- dz — x — dx. 

L’aire du parallélogramme est dxdz. 

L’intégrale double sera la somme des éléments relatifs à 
chaque parallélogramme 

hh' 

dx d 3 — 

i: 

Dans une première intégration, y et z doivent être regar¬ 
dées comme constantes et x varie de — oo à -f- oo. 
L’intégrale est donc 

dz— r dx. 

« J— 

Posons 

P = h*x\-+- fi' 2 (x — z)*, 

c’est-à-dire 

P = (/i 2 -t- h' 2 )x -— 2 h' 2 xz -f- h'-z-, 
ou 

P = (ax — b)--{- c 

en posant 

, h'-z 

b =- 5 

a 


c = h n z*—b i . 
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Nous avons à évaluer 


e~ v dx 


ou 


Posons 


cette intégrale est 


/• 

J ' e-& x -W- C dæ. 

aæ — b = £; 


e-a J" 

et finalement, comme æ ou \ varie de —« à -t-œ, 

_ c ^ 
e c -—. 
a 

La probabilité cherchée, pour que z soit compris entre 
et z + dz, est donc 


dz 


hh’ 


On a, d’autre part, 




\/ 7 r a 


h! K z 2 A 2 A ' 2 s 2 


h 2 -H h ' 2 ~ h 2 -h h ' 2 


La probabilité en question est donc 

/i= Ir- 

hhf_ e Z 
v/ïr v'/i 1 -+- h ' 2 

La loi de probabilité est normale. 

La valeur probable de z 2 ou de (x-\-y ) 2 sera 
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c’est-à-dire que la valeur probable de {x -t-y ) 2 est la somme 
de la valeur probable de x- et de la valeur probable de y 2 . 

La valeur probable de 2 xy est, en effet, nulle ici, et 
nous ne l’aurions pas su a priori, si la loi de probabilité 
n’avait pas été normale. 

Cette élégante démonstration est due à M. d’Ocagne. 

61. Problème des épreuves répétées. — Deux événe¬ 
ments contraires, A et B, ont pour probabilités respectives 
p et q. Ainsi une urne contient^, boules blanches et v boules 
noires, 

p- v _ 

P . . j Q — . 

r fi-t-v 7 /x -+- v ’ 

on en tire un très grand nombre de boules m, en remettant 
chaque fois la boulesorlie dansl’urne. Si l’on a tiré « boules 
blanches, il y a beaucoup de chances, d’après le théorème 

de Bernoulli, que diffère peu de l’unité. 

La valeur probable de X 2 sera égale à pq. 

Changeons un peu les conditions, de manière que le 
hasard ne préside plus seul à la distribution des coups. Con¬ 
sidérons deux urnes, la première renfermant /x boules 
blanches et v noires, la seconde p! blanches et v' noires, et 
convenons de tirer alternativement dans l’une et dans 
l’autre. 

Après un très grand nombre, m, de tirages, a blanches 

sont sorties et m — a noires. Alors — sera très voisin de p 

m 1 

qui est ici égal à 

1 ^ , r & . 

2 p.-h V 2 pJ -t- v' 

Mais la loi des écarts sera-t-elle la même? 11 ne peut en 
être ainsi. 


P. 


9 



CHAPITRE VI. 


1x4 

Supposons que la première urne ne renferme que des 

blanches, la seconde que des noires : nous aurons tiré ^ 

blanches et — noires. Alors — sera égal à —» et l’écart sera 
2 m 2 

nul,/? étant aussi La valeur probable de X 2 sera zéro; 

elle devrait être égale à yj.car 
4 



La loi des écarts n’est donc pas la même. 


62. Je veux montrer que, si une autre cause que le hasard 
intervient, l’écart probable (ou la valeur probable de X 2 ) 
sera plus petit que si le hasard seul avait agi. 

Les m épreuves forment deux catégories, l’une de (3m, 
l’autre de [3'm épreuves, et l’on a 

(3 (3'=xt. 


Supposons que les événements A et B aient respective¬ 
ment* pour probabilités, p et y dans la première catégorie, 
p' et q ! dans la seconde. 

L’événement A se présente a fois dans la première, a’ fois 
dans la seconde ; B se présente fim — a et {3 'm — a' fois. 

Le nombre total des épreuves favorables à A sera a a'; 


a sera très voisin de {3 mp, et a' de {3 'mp'; 


et 


{3 mp fi'mp' 


s’écarteront très peu de l’unité; a-ha' sera très voisin de 
{3 mp -t- {3 ’mp', c’est-à-dire que l’écart sera de l’ordre de 
grandeur de \fm, de sorte que la répétition des événements 
sera à peu près la même que dans une seule série d’épreuves, 
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où les probabilités de A et de B seraient respectivement 
$p+$'p' et $q -t- (3V- 
Cherchons la loi des écarts. Je vais poser 

a. — (3 mp -i- X \/(3 m, 
a! = (3' mp' + X' \/ (3 'm. 

Pour l’épreuve totale, ce serait 

a -+- al—m{^p -+- (3'/?') -+- X" \frri, 

fip + P'p' étant la probabilité de A dans l’ensemble des 
épreuves. 

Composons les valeurs probables de X 2 , X' 2 , X" 2 , que nous 
écrirons (X 2 ), (X' 2 ), (X ï2 ). 

Nous aurons 

(l 2 )—pq, (7J*)=p'q\ 

et de même, si le hasard agissait seul , on aurait 


(X" 2 ) — {^>p + P'p') {pq -t- P'q')- 


Cherchons sa véritable valeur. 

Nous avons 

W \fm=.'k\JÇ> m -{- X' y/ [3' m 
ou 

X'=xv/P + X'v^. 

Les deux événements sont indépendants : la probabilité 
pour que X soit compris entre deux limites données est 
indépendante de la probabilité pour que V soit compris 
entre deux limites données. Les lois de probabilités de Xy/(3 
et X' y/(3' seront normales, et la loi de probabilité de leur 
somme X y/(3 -t- X' y/jÿ sera aussi normale. 
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La valeur probable de À" 2 sera 

(X^ ) = { 3(^) + p'(x«)= p Pq + p'py. 

Telle sera la véritable, expression de la valeur probable du 
carré de l’écart. 

Comparons les deux valeurs; la différence est 

((3/7 H- (3 'p') ((3 q-h fi r q') — (@pq + (3 'p'q') 
ou, en rappelant que (3 + (3' = i, 

((3/7 + (3 'p') ((3? + |3y ) — (fipq + (3'/?'gO ((3 + (3'), 
c’est-à-dire 

PP' (/V +p’q—pq —p' q' ) 

ou 

(3(3'(/>— p')W—q)- 

Or 

p — p'=q'—q- 

La différence envisagée est donc positive, et l’on a 

63. On utilise cette propriété dans la statistique. On a 
relevé des observations dans un Tableau, et l’on veut voir 
si les différences observées sont dues au hasard, ou si le 
hasard n’intervient pas seul. 

On compare, pour un certain nombre de cas, le rapport 
du nombre des arrivées de À à celles de B. 

Soient N et N' le nombre total des arrivées de À et de B; 
on aura 

_ N _ N' 

p N + N ,) ^ N h- N' ’ 

Divisons, maintenant, le Tableau en plusieurs séries; soit 
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dans chacune de ces séries m le nombre total des épreuves 

et _ 

a = pm -+- X sjm 

le nombre des épreuves favorables à A. On calculera X pour 
chaque série ; on chercherala moyenne arithmétique de X ! ; 
si cette moyenne est égale à pq, le hasard intervient seul; si 
elle est plus petite que pq, il intervient une cause indépen¬ 
dante du hasard. 



CHAPITRE VH. 

PROBABILITÉ DU CONTINU. 


63. Paradoxe de J. Bertrand. — Nous avons été amenés 
à considérer un nombre très grand de cas possibles, mais 
ce nombre restait fini. A certains moments, nous avons envi¬ 
sagé des questions de limites et remplacé les ^ P ar c ^ es J "• 

Nous allons arriver aux problèmes où le nombre des cas 
possibles devient infini. 

Il faut bien définir ces cas, et le paradoxe de J. Bertrand 
mettra bien en évidence le genre spécial d’erreurs que ces 
problèmes peuvent entraîner ; il s’agit de la question sui¬ 
vante : 

Quelle est la probabilité pour qu’une corde d’une circon¬ 
férence donnée soit plus grande 
que le côté du triangle équila¬ 
téral inscrit? 

J. Bertrand traite le problème 
de deux manières, et les résul¬ 
tats sont absolument opposés. 

Soit AB la corde; nous pre¬ 
nons le rayon OA comme unité ; 
les coordonnées polaires de A 

seront i et m. 

Soient a l’angle AOM, OM étantlaperpendiculaire abaissée 
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du centre sur la corde, P le point oh cette perpendiculaire 
rencontre la courbe etM le milieu de la corde. 

L’angle PCLc, ou 8, est égal à a -+- «. 

64. Premier raisonnement. — Le point A peut se trouver 
en n’importe quel point de la circonférence. La probabilité 
pour que « soit compris entre o ) 0 et a) t est proportionnelle à 
la différence ——— • Le point A déterminé, la corde peut 

27T ‘ 

prendre toutes les directions possibles, c’est-à-dire que, A 
étant choisi, je puis faire prendre à a toutes les valeurs 
possibles entre o et-- 

La probabilité pour que oc soit compris entre a 0 et a t est 
proportionnelle à a t — Si AB était le côté du triangle 
équilatéral inscrit, a serait égal à 60 °. 

Comme a. peut prendre toutes les valeurs de o° à 90 0 , la 
probabilité pour que la corde soit plus grande que le côté 
du triangle est 

90 °— 6 o°_ 1 

90 0 —o° — 3* 

65. Deuxième raisonnement. — La corde peut avoir une 
direction quelconque. La probabilité pour que 8 soit compris' 
entre 0 O et 8 t est proportionnelle à 8 t — 8 0 . 

Cette direction une fois choisie, je trace OP : la droite AB 
sera définie quand je connaîtrai le point M, c’est-à-dire la 
distance OM — p — cos oc. 

p peut prendre toutes Les valeurs de o à 1 ; on doit admettre 
que la probabilité pour qu’il soit compris entre p 0 et p t est 
proportionnelle à p t — p 0 . 

Si OM est compris entre o et i, la corde est plus grande 
que le côté du triangle. 

La probabililé sera donc 
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Pourquoi cette contradiction? Nons avons fait des hypo¬ 
thèses différentes dans les deux cas; nous avons défini la 
probabilité de deux manières différentes. 


66. D’une manière générale, on demande de définir la 
probabilité pour qu’un nombre x soit compris entre x 0 et# t : 
en général, nous pouvons dire que nous n’en savons rien 
du tout. 

Cette probabilité doit dépendre de # 0 et de x t : ce sera 
donc une fonction telle que P (x 0 , # t ). 

Si nous cherchons la probabilité pour que # soit comprise 
entre x 0 et x it 


en vertu du principe de la probabilité totale, cette probabi¬ 
lité sera 


Si 
on a 


P(# 0 , #î) = P(# 0 , Xi) + V(x lf x 2 ). 


#2 —— #1 —!— dXy^ 


P(#o> P(^o* *^1 ) — P(^o, ^*1 —1— 


Celte probabilité sera infiniment petite, et, en divisant 
par dx u elle ne dépendra que de x u 
On aura donc dans tous les cas 


P(^„. 



<p (x)dx. 


Mais nous ignorons la nature de cp'(#) qui reste arbitraire: 
il faut nous la donner au début du problème par une con¬ 
vention spéciale pour qu’il ait un sens. 

De même, la probabilité pour que le point (#, y) soit à 
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l’intérieur d’une aire donnée est 


ff‘ 


y {a;, y)d.vdy. 


l’intégrale double étant étendue à tous les éléments de l’aire ; 
mais nous ne connaissons pas y(x, y). 

Le mathématicien n’a plus aucune prise sur le choix de 
cette hypothèse; mais il doit, une fois qu’elle est choisie, 
porter son attention à ne pas en faire une autre qui la con¬ 
tredise. 


67. On peut avoir plusieurs paramètres x u a; 2 , x p . 
L’intégrale d’ordre p, 



., sCp J d tïj , dx g 


.. doSpy 


définira alors la probabilité pour que les paramètres x satis¬ 
fassent à certaines conditions, quand la fonction cp 
définie; il n’y aura qu’à étendre l’intégration à toutes les 
valeurs de x qui satisfont aux conditions données. Mais 
cette définition n’aura de sens que quand on se sera donné 
la fonction 9 par une convention préalable. 

Je suppose qu’on change de variables et qu’on prenne 
yu yî, •.., ; l’intégrale va se transformer en 



d{æ u x % , . 

à(yi, y-i, • 


1 æ p) 

’ yp ) 


dyi dy ï ... dy p , 


à l’aide du jacobien ou déterminant fonctionnel des x par 
rapport aux y. 

Cette nouvelle intégrale multiple est entièrement déter¬ 
minée ; on étendra l’intégration aux limites des y qui cor¬ 
respondent à celles des x, et qui sont connues, puisqu’on 
connaît les relations qui lient les x et les y. 



122 


CHAPITRE VII. 


68. Appliquons ceci au paradoxe de J. Bertrand. 

Dans la première manière de raisonner, les variables 
étaient u et a, dans la seconde 8 et p. 

Dans la première manière, la probabilité pour que « fût 
compris entre o) 0 et m, était proportionnelle àe, — <a 0 ; pour 
que a fût compris entre a 0 et oc u elle était proportionnelle 
à a.1 — 

Cette probabilité se représentait par 


//' 


efcxfa, 


étendue à tous les systèmes de valeurs de u et a qui satis¬ 
faisaient à ces conditions. 

Dans la seconde manière, nous avons supposé que 8 et p 
pouvaient prendre toutes les valeurs possibles avec une 
égale probabilité, et nous avons représenté la probabilité 
cherchée par 



Ces deux hypothèses ne sont pas les mêmes, comme nous 
l’avons déjà constaté directement. Cherchons le détermi¬ 
nant fonctionnel ; on a 

dp— —sin ct.da, dd = d<ù-hd<x. 

Ce déterminant 

o —sin a 

i i 


est égal à sin a. Donc la deuxième intégrale est 


ff 


sin tx dcà doc. 


ce qui n’est pas la même chose que la première. 
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69. Autre exemple. — Soit une droite AB, dans un plan; 

ses coordonnées tangentielles sont i et —■ Étudions ia 

probabilité pour que cette droite ait une certaine position. 
La probabilité pour que a et b 
prennent toutes les valeurs 
comprises entre certaines li¬ 
mites peut être, par une 
première convention, repré¬ 
sentée par 


//■ 



dadb, 


Fig. 4 . 


où b — «tango), si a est l’angle de AB avec Ox. 

On peut aussi dire : 0 ) peut prendre toutes les valeurs 
possibles; d’où pour la probabilité 


//' 


doc da. 


Ce n’est pas la même chose, et cette seconde convention, 
qui, après un examen superficiel, pourrait sembler aussi 
légitime que la première, esi en contradiction avec elle; en 
effet, le déterminant fonctionnel est 


et 


a 

cos 2 o)’ 


//**=//■ 


a 


co s-o) 


-da dcù. 


70. Problème du bâton brisé. — On partage un bâton, 
de longueur 1 , en trois parties x, /, z. 

x-hy-hz = i. 
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Nous admettrons que la probabilité pour que x soit 
compris entre# et#+e?#est, par définition,proportionnelle 
à dx ; entre # 0 et x u elle sera proportionnelle à xi — x 0 . 

De même la probabilité pour que y soit compris entre y 0 
et y, sera, par définition, proportionnelle àyi—y 0 . 

La probabilité pour que x et y satisfassent à certaines 
conditions est alors l’intégrale 


//' 


dxdv 


étendue à toutes les valeurs de x et de y qui satisfont à ces 
conditions. 

On pourrait supposer également que cette probabilité est 

ffayi;, 

ou bien 



puisqu’on peut prendre x et z, ou bien y et z, comme va¬ 
riables. 

Ces trois définitions sont ici équivalentes; on a 

et le déterminant fonctionnel est bien égal à i, puisque 


x — #, 

z=i — x— y. 


71. Quelle est la probabilité pour que x, y et z forment 
un triangle? 

Traçons un triangle équilatéral dont la hauteur soit t : 
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d’un point M, intérieur à ce triangle, abaissons des perpen¬ 
diculaires sur les trois côtés. La somme des trois longueurs 
ainsi obtenues sera égale à la hauteur 
du triangle, c’est-à-dire à i ; elles 
représenteront les trois morceaux, 

#, y, s, du bâton. 

Le point M peut être considéré 
comme représentant le mode de divi¬ 
sion du bâton : quelle est la proba¬ 
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bilité pour que ce point soit à l’intérieur d’une certaine aire? 

La probabilité pour que# soit comprise entre# el#-f-e?#, 
et pour que y soit comprise entre y et y -y-dy, est propor¬ 
tionnelle à dxdy. Le point M sera alors 
dans une aire comprise entre deux paral¬ 
lèles à BC menées à des distances # et 
x-r-dx de BC, et deux parallèles à AC 



&■? 


Fig. 6. 


menées à des distances y et y+dy de AC. Le parallélo¬ 
gramme ainsi formé a pour angles 120 ° et6o°, et son aire est 

dx dy 
sin 6o° 


La probabilité sera, dans ce cas, proportionnelle à l’aire 
du parallélogramme; et, en général, 
elle sera proportionnelle à l’aire envi¬ 
sagée. 

Le point M devant être à l’intérieur 
du triangle ABC, la probabilité pour 
qu’il soit à l’intérieur d’une certaine 
aire est le rapport de celte aire à la 
surface du triangle. 

Joignons par des droites les milieux A' B' C' des côtés du 
triangle. M doit être à l’intérieur de A' B' C' pour qu’on 


A 
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puisse former un triangle avec as, y, s ; si le point M est sur 
l’un des côtés de À'B'C', "une des équations suivantes est 
satisfaite, 

s —as-hy, x — y-\-z, y = z-h as; 


si le point M est eu dehors de À'B'C', l’une des trois gran¬ 
deurs x, y , z est plus grande que la somme des deux, autres. 
La probabilité pour que l’on puisse former un triangle 

avec æ, y, z est donc j- 


72. Problème de l’aiguille. — Sur une feuille de papier, 
sont tracées un certain nombre de droites parallèles et équi¬ 
distantes ; leur distance commune est d, et l’on jette au 
hasard sur la feuille une aiguille également de longueur d. 

Quelle est la probabilité pour que celte aiguille rencontre 
l’une des droites? 

La question peut se poser d’une manière plus générale. 



Fig. 8. 


Soient deux axes fixes ox, oy, et une figure fixe F inva¬ 
riablement liée à ces axes. 

Soient d’autre part deux axes mobiles OX, OY, et une 
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figure F l invariable de forme, mais invariablement liée à ces 
axes, et par conséquent mobile avec eux. 

Définissons la position de la figure mobile par rapport 
aux axes fixes. 

Soient M un de ses points, MP une droite passant par M et 
invariablement liée à la figure F t : il suffit de définir la posi¬ 
tion de MP par rapport à xoy. Celte position est définie par 



les coordonnées x, y du point M et l’angle aide MP avec ox. 

La probabilité pour que M satisfasse à certaines condi¬ 
tions est proportionnelle à 


J'J' f dxdydat. 


Pour justifier cette définition, je vais montrer qu’elle est 
la même quand je prends un autre point M' de la figure 
mobile, ainsi qu’une autre droite M'P'. 

La droite M'P' sera invariablement liée à MP. 

Soient l la longueur MM', a. l’angle de MM' avec MP et (3 
l’angle de M'P' avec MP :/,<*,[3 sont des constantes. 

La droite M'P' est définie relativement aux axes xoy par 
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Jes coordonnées x', y' du point M' et l’angle g/ de M'P' 
avec oæ. 

Si la probabilité pour que la figure mobile satisfasse à 
certaines conditions est, d’après la première évaluation, 


elle sera aussi 


J'J'J'dxdydtù, 
J'J'J* dx'dy’da’. 


Le déterminant fonctionnel est en effet égal à l’unité; on 
a, par projections, 

x' — x -1- /cos(a) -+- a), 
y'— y H- /sin(a) H- a), 
f»)'— ai H— ^3, 


et le déterminant fonctionnel 


y ,y,a v- e st 

à(æ,y,a>) 


i o —fsin(oH-a) 
o i Zcos(aH-a) 
oo i 

c’est-à-dire i. 

La loi de probabilité est donc la même, quelle que soit la 
droite MP choisie. 


73 . Si je considère deux figures 9, 9', égales entre elles 
et invariablement liées aux axes mobiles, la probabilité pour 
que 9' satisfasse à certaines conditions est égale à la proba¬ 
bilité pour que 9 satisfasse aux mêmes conditions. Consi¬ 
dérons une droite MP invariablement liée à 9 et une autre 
droite M'P' dont la position par rapport à 9' est la même 
que celle de MP par rapport à 9 ; soient x, y, «, d’une part. 
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af, y, u', d’autre part, les quantités qui définissent la posi¬ 
tion de ces deux droites. 

La position de 9 est définie par x, y et « ; celle de 9', par 
od , y', ai'. Pour que 9 satisfasse à 
certaines conditions, x,y ,a devront 
satisfaire à certaines inégalités. 

Pour que 9' satisfasse aux mêmes 
conditions, x', y', ai' devront satis¬ 
faire aux mêmes inégalités. A la 
différence près des notations, on 
retombe donc sur la même inté- 

Fig. 10 . 

grale. 

La valeur de la probabilité est donc la même dans les deux 
cas. 

74 . On demande la probabilité pour qu’un segment de 
droite limitée, MP, rencontre les parallèles du problème de 
l’aiguille. Si une seconde droite, M'P', de même longueur, 
est invariablement liée à MP, la probabilité pour qu’elle 
rencontre les parallèles sera la même. 

Si, au lieu de MP, on considère une droite deux fois plus 
longue, MQ, la probabilité sera doublée, puisqu’elle se com¬ 
pose de deux droites égales à MP, à savoir MN etNQ,N étant 
le milieu de MQ. 

Je suppose qu’on promette à un joueur autant de francs 
qu’il y aura de points d’intersection de la droite avec les 
parallèles (*). L’espérance mathématique du joueur avec 
MQ sera double de son espérance avec MN, puisqu’elle sera 
celle qu’il tire de MN augmentée de celle qu’il tire de NQ. Eu 
général, elle sera proportionnelle à la longueur de la droite. 

( 1 ) Bien entendu, si l’une des extrémités de MN tombe sur une des 
parallèles, cela comptera pour une demi-intersection. 

P. 



10 
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Si NQ n’est pas dans le prolongement de MN, l’espérance 
mathématique est encore doublée. L’espérance mathéma¬ 
tique est donc proportionnelle à la longueur totale de la 
ligne, qu’elle soit droite ou brisée, ou même, en allant plus 
loin, quelle que soit sa forme. 

Si l’on promet autant de francs que de points d’intersection 
de la courbe avec les parallèles, l’espérance mathématique 
sera ainsi proportionnelle à la longueur de la courbe. 

Si la courbe est une circonférence de diamètre d, sa lon¬ 
gueur sera rof; dans ce cas, il y aura toujours deux points 
d’intersection, l’espérance mathématique sera donc 2. Pour 

une courbe de longueurs, cette espérance sera pour une 

droite de longueur d, ce sera — 

ir 

75 . Revenons sur le paradoxe de J. Bertrand relatif à la 
probabilité pour qu’une corde d’une circonférence soit plus 
petite que le côté du triangle équilatéral inscrit. 

Traçons une circonférence C', concentrique à la première 
C et dont le rayon soit la moitié du sien. Plaçons au hasard 
une droite dans le plan. Si nous adoptons la convention 
faite tout à l’heure au sujet de l’aiguille, la probabilité dé¬ 
pendra-t-elle d’une nouvelle et troisième hypothèse, ou bien 
de l’une des deux précédemment examinées? 

Jepuis supposerla droite fixe etles circonférences mobiles. 
La probabilité pour que l’une des circonférences coupe la 
droite est proportionnelle à sa longueur; la probabilité pour 
que C' rencontre la droite est donc le rapportées longueurs 

des deux circonférences, c’est-à-dire — • On retombe ainsi 

2 

sur l’une des hypothèses de J. Bertrand. 
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76. Prenons encore un problème analogue au problème 
de l’aiguille : 

Sur une sphère S on trace une figure mobile ; quelle est 
la probabilité pour que cette figure satisfasse à certaines 
conditions ? 

Comment définir d’abord la position de cette figure ? 

Soit P 0 la position initiale, P t la position finale de la 
figure mobile : on passe de l’une à l’autre par une rotation 
convenable, définie par l’axe de rotation et l’angle de rota¬ 
tion. 

Soient a, (3, y les cosinus directeurs de l’axe, et 2 9 l’angle 
de rotation ; posons 

X = cos0, /x = asin0, v = (3sin0, p = ysîn0, 

et prenons X, p, v, p comme variables. 

Elles sont liées par une relation 

X 2 + p. 2 + v 2 + p 2 =I. 

Je retronve la même relation, si je change les signes de 
X, p, v, p, et il suffit de connaître trois de ces quantités. 
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Je suppose la probabilité représentée par une intégrale 
triple 


/ 


dp. dv dp 

T~’ 


elle sera représentée aussi par 

Çdk dv dp 

J £ 

Cherchons en effet le déterminant fonctionnel des nou¬ 
velles variables X, v, p par rapport aux anciennes p, v, p, et 
supposons X défini en fonctions de p, v, p. 

ldk = — p dp. — v dv — p dp. 

Le déterminant fonctionnel est 


£ 

X 

o 

o 


V 

X 

i 

o 


p 

X 

0 

I 


£ 

X 


Ainsi, au signe près, par le changement de variables, 
l’élément de l’une des intégrales triples devient l’élément 

de l’autre intégrale, après multiplication par —■ Donc 

/ ’ dp.dv dp ÇcCkdvdp 

* 6 J ¥■ 

donnent donc bien la même définition pour la probabilité. 

Voici comment se justifie celte convention: considérons 
la sphère 

sc z -{- j 2 -t- s 2 =: i. 

Supposons que la probabilité pour qu’un point quelconque 
de la sphère se trouve à l’intérieur d’une certaine aire- 
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sphérique soit proportionnelle à cette aire. Cette aire s’ex¬ 
primera par l’intégrale 



dx dy 
cos nh 



cos ni étant le troisième cosinus directeur de la normale 
à la sphère au point considéré. 

Nous avons fait ici une hypothèse tout à fait analogue, 
car 

-yî _j_ p2 —- j 


serait l’équation d’une sphère dans l’espace à quatre dimen¬ 
sions. 


77. Je suis parti précédemment de la position initiale P$. 
La rotation X, p, v, p ne dépend pas seulement de P t , elle 
dépend aussi du choix de la position initiale P 0 . 

Je vais démontrer que la probabilité reste la même, si, 
au lieu de la position initiale P 0 , on en considère une 
autre PJ. 

La rotation de P' à P t sera définie par X', p', v', p', et la 
probabilité sera définie par 

r du.' dv' dd 

J ï' 

Je dis qu’elle sera proportionnelle à la précédente. 

I, in, n, r définissant la rotation de P£ à P 0 , la rotation 
X', p', v', p' sera la résultante de deux autres. Les formules 
connues de la composition des rotations sont 

X' = XZ —p/w — vn —pr, 
pj — \m p.1 —vr +p n, 
v'—~kn -t- pr -+-vl — pm, 
p'= Xr —p» -hvm-i- pl. 
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Il s’agit maintenant de calculer le déterminant fonctionnel 
de X', p', v', p' par rapport à X, p. v, p. Je pose 

o-=V/X î -i-p. 2 -i-v 2 -i-p 2 . 

Ici ir—i, mais je puis supposer à X, p, v, p des valeurs 
quelconques au lieu des valeurs véritables. 

De même 

\/X' ! -l- p'* -i- v' 2 -+- p' 2 . 

Quelles que soient ces valeurs, on a 

<j'= (7 y7 2 -1- TW 2 h- » 2 -+- z -2 , 

et si 4 TW, zi, /• ont les valeurs constantes données, 

(/= a. 


Il s’agit de calculer 


d(p\Y, p') , 
à{p, v, p) ’ 

en supposant <7= i, c’est-à-dire 


dpd 

dp’ 

âp r 

d[X 

!h 

dp 


dv' 

dv' 

dp. 

dv 

~àp 

dp' 

Èl 

dp’ 

dp 

dv 

dp 


Mais je vais porter le nombre des variables à 4. et consi¬ 
dérer, d’une part <7, p., v, p, d’autre part < 7 ', p/, v', p'. Comme 
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a' = ff, les dérivées partielles de a seront i, o, o, o 


I 

0 

0 

o 

dp' 

dp' 

dp' 

dp' 

âa 

dp 

àv 

dp 

âv f 

àv' 

àv' 

àv' 

da 

dp 

d7 


<¥ 

à_l 

â£ 

dp' 

âa 

dp 

âv 

dp 


C’est bien le même déterminant fonctionnel ; on peut donc 
déjà écrire 

à(p',v\p') _ à (a', p', v', p') 
à(p,v.p) à{<7, p,v,p) 

_ d(a', p.', v', p') d(V, p.', v', p') d(X, p., v, p) 
à(k',p',v',p') d{l,p,v, p) d(a,p,v,p)' 

Evaluons successivement les trois derniers déterminants 
fonctionnels. Le premier est 

du' àa' du' à a' 
àV dp.' àv' dp’ 



0010 

oooi 

Le second est 

L — m —n — r 

m L — /■ n 

, =(l 2 +m’-+n--h r*)*=i. 

n r L — m 

r — n ni l 

L-e troisième est 

â(A, p,v, p) _ i _ —JL — Z. 

à{a, p, v, p) ~ d(cr,p,v,p) ~ 1 ~~ À 
à{l,p,'J,p) a 
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Le produit des trois est donc-^-j et l’intégrale 

À 


f dp' dv' do' 

J 

/ dp dv dp 

~ï r ~ 

/ dp dv dp 


se transforme en 


dp. dv dp V 

ÿ T 


La définition de la probabilité reste donc la même, quelle 
que soit la position initiale. 


78. On demande la probabilité pour que cette figure P 0 
satisfasse à certaines conditions. 

Si on considère une autre figure P' égale à la première 
et invariablement liée à celle-ci, on peut demander aussi la 
probabilité pour que celle seconde figure satisfasse à cer¬ 
taines conditions. Soient alors X, p, v, p les paramétrés de 
la rotation qui amène P 0 en P lf et X', p 1 , v', p' ceux de la 
rotation qui amène P' 0 en P 4 . 

La probabilité pour que P„, venu eu P t , satisfasse à cer¬ 
taines conditions, est représentée par 



les paramètres X, p, v, p devant satisfaire à certaines inéga¬ 
lités. 

La probabilité pour que P 0 venu en P, satisfasse aux mêmes 
conditions est représentée par 

f dp' dv' dp' 

J T ’ 
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les paramètres 1', p', v', p' devant satisfaire aux mêmes iné¬ 
galités. Les intégrales, ne différant que par les notations, 
sont identiques, et la probabilité reste la même. 

Les probabilités pour que deux figures mobiles, égales, et 
invariablement liées l’une à l’autre, satisfassent à une même 
condition, sont donc égales entre elles. 


79. Choisissons une autre forme où n’apparaîtront pas 
1, p, v, p. 

Je définis la position d’un point M de la figure mobile par 
ses coordonnées x, y, z et celle d’un arc de grand cercle MP 
par l’angle m que fait MP avec MA, MA étant un arc de 
grand cercle qui passe par un point fixe A. 

La probabilité s’écrira 


J" *F dx dy 


dus, 


où est une fonction de x, y, z et m. 
En prenant 


dx dy ~z du 

du est l’élément de surface de la sphère et l’intégrale devient 


/ 


<9 du dus. 


Celle intégrale doit être étendue à tous ceux des éléments 
u de la surface de la sphère et à toutes lesvaleurs de l’angle 
m qui satisfont aux conditions. En revenant à a; et y comme 
variables, elle s’écrit 


80. Je dis que la forme de <D reste la même quelle que 
soit la position de A. 
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Considérons un autre point fixe B, et soit m' l’angle de 
MP avec MB, |3 celui de MB avec MA.. 


m'= m -t- [3. 



Fig. ii. 


Au Jieu de æ, y, m, les variables seront 

Le déterminant fonctionnel ^^y , M ^ est 

à(x,y, m) 

égal à 


10 0 
o i o 

d A W t 

dx dy 


= i. 


81. La fonction <D est indépendante de «. 

En effet, considérons un autre arc de grand cercle MP', et 
soit m" l’angle de MP' avec MA, a l’angle de MP' avec MP 

<a" m - 1 - et. 

La loi de probabilité ne sera pas changée. 

y-» 

j <&dad(x> 

exprime la probabilité pour que MP satisfasse à certaines 
conditions. 

J' J> da da" 

exprimera la probabilité pour que MP' satisfasse à ces 
mêmes conditions. Ces deux probabilités doivent être égales, 
d» ne dépendra donc pas de m. 


82. La fonction d> ne dépend pas non plus de xety. 
Soient en effet da et du 1 deux éléments de surface de la 
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sphère égaux entre eux. Soient l, m, n, r les paramètres 
d’une des rotations qui change du en du’. Soient X, p, v, p 
ceux d’une rotation qui amène 
la figure mobile dans une po¬ 
sition telle que M soit intérieur 
à du. Soient V, p', v', p' ceux 
d’une rotation qui amène M à 
l’intérieur de du'. 

Soient x, y les coordonnées 
du centre de gravité de du-, 
x', ^ celles du centre de gra¬ 
vité de du'. F * s ‘ I2 ‘ 

Les paramètres X', p', V, p seront des fonctions linéaires 
de X, p , v, p d’une part, de l, m, n, r d’autre part ; [on n’a, 
en effet, qu’à se reporter à la formule de composition des 
rotations citée plus haut. On aura d’ailleurs, comme nous 
l’avons vu plus haut, 



J' dp dv dp _ J' 


dp’ dv’ dp’ 
X 7 


La probabilité pour que M soit intérieur à du est 
J' du J' ^ du = 2 n<S>(x, y) du =j' dpdvd\^ 


les paramètres X, p, v, p devant satisfaire à des inégalités 
qui expriment que la rotation correspondante amène M à 
l’intérieur de du, et l’intégrale étant étendue à toutes les 
valeurs de ces paramètres qui satisfont à ces conditions. 

La probabilité pour que M soit intérieur à du’ est 

™*(x',r')du’=f d r ,d *' d P'. 
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On a donc 

<& (x, y) da = (ce', y') da'. 

ou, puisque da = da r , 

l’intégrale étantétendue à toutes les valeurs de p.', v', p' qui 
sont telles que la rotation X', p/, v', p' amène M à l’intérieur 
de da'; ou, ce qui revient au même, telles que la rotation 
X, p, v, p amène M à l’intérieur de da. 


83. Nous avons ainsi écrit la loi des probabilités sous une 
autre forme, mais c’est la même hypothèse que celle que 
nous avons faite, quand nous prenions pour variables X, p, 
v, p. En résumé, la probabilité pour que M soit à l’intérieur 
d’une certaine aire da, et, en même temps, pour que MP 
fasse un angle m avec MA, est 

J *® da da>, 

et $ est une constante à déterminer. 

Étendons l’intégrale à tous les éléments de la sphère ; 
l’angle m variera de o à 2 n, et a de o à 4rc. L’intégrale aura 
pour valeur 

47T<& X 27r = 8n 3 <I>; 


mais alors la probabilité sera égale à 1 . Donc 


et 



J 


‘dada 
87T* 


OU 


/ 


dæ dv dut 
8tt -z 


est la loi des probabilités. 
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84. Soient, sur Ja sphère, une courbe fixe ët une courbe 
mobile; on promet à un joueur autant de francs qu’il y aura 
de points d’intersection : quel est son espérance mathéma¬ 
tique? 

Elle est proportionnelle au produit des longueurs des 
deux courbes. 

85. Si l’on considère une figure mobile <p et deux figures 
fixes ©d <p 2 , la probabilité pour que <p ait une position rela¬ 
tive donnée par rapporta <p x est la même que la probabilité 
pour que <p ail la même position relative par rapport à <p 2 . 

Autrement dit, supposons que X, p t v, p définissent la ro¬ 
tation qui amène <p t dans une position <p'; prenons comme 
variables nouvelles V, p.', v', p' qui définissent la rotation 
qui amène ep 2 dans celte même position <p' : nous retrouve¬ 
rons la même loi de probabilité et nous aurons comme plus 
haut 

f dp. dv dp _ fdp’ dv’ dp' 

J ~ ~J ^ 

La rotation X', p', V, p ' est la résultante de deux autres, 
X, py v, p et l, m, n, /•; cette dernière, celle qui amène <p 2 
dans la position <p,, peut être considérée comme donnée, 
et le calcul du déterminant fonclionnel de p, v, p par rap¬ 
port à p.', V, p' est le même que dans la leçon précédente. 

Cela posé, je ne conserverai pas les paramètres X, p, v, p, 
dont la signification géométrique n’est pas simple, et nous 
reviendrons aux variables x, y et m du paragraphe 79. 

86 . Soient, sur la surface sphérique, M un point de la 
figure mobile ayant pour coordonnées æ, y, z\ et MP un 
arc de grand cercle appartenant à la figure mobile et faisant 
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un angle m avec l’arc de grand cercle MA qui passe par un 
point fixe À. 

i° Quelle est la probabilité pour que M soit dans une aire 
da, lorsque &> varie de o à27r? 

C’est 


/ 


dada 


da 


2 ° Quelle est la probabilité pour qu’un cercle mobile de 
la sphère coupe un cercle fixe? 

Soient P le pôle du cercle fixe, À le point où il coupe le 
tableau, et 9 l’angle POA. 

Soient P', A', 9 ' les données analogues pour le cercle 
mobile. 

Soit 9 l’angle POP'. 



p 



La condition nécessaire et suffisante pour l’intersection 
est qu’on ait à la fois 

9 < 9 -t- 9 ', 

9 > 0 — 9 ', 

en supposant 9 > 9 '. 

Représentons la zone BCB'C' dans laquelle le pôle P' du 
cercle mobile doit se trouver; par projection sur le plan du 
tableau, les denx petits cercles qui la limitent serontfîgurés 
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par des droites B B', CC'; l’angle POB sera égal à 6 — 6 ', et 
l’angle POC à 6 -4- 9'. 

La probabilité cherchée sera proportionnelle à la hauteur 
bc de cette zone. Or, 

bc = Ob — Oc — cos(0 — Q') — cos (6 -t- Q'), 
bc = 2 sin0sin0\ 

87. Le problème peut être plus général. Soient : i° «arcs 
de grands cercles fixes Ci, C 2 ,..., C„, égaux entre eux et de 
longueur l\ 2 ° n' arcs de grands cercles mobiles, invaria¬ 
blement liés les uns aux autres et de même longueur l, 
C C C , 

W i '-‘ 2 J * • * 9 ^ ri • 

Je cherche les points d’intersection des arcs mobiles avec 
les arcs fixes et je promets autant de francs que de points 
d’intersection. 

L’espérance mathématique du joueur sera proportion¬ 
nelle à nnJ . 

La probabilité pour que C' t rencontre C t est la même que 
pour que C 2 rencontre C t , etc., d’après la démonstration de 
tout à l’heure. 

Elle reste encore la même pour que C' t rencontre C 2 , etc. 

L’espérance mathématique sera d’autant de francs que 
l’on peut faire de combinaisons de l’un des n premiers arcs 
avec l’un des n' seconds. Supposons même que ces derniers 
aient une longueur V différente de l : l’espérance mathé¬ 
matique sera nn'll'. 

Si l’on considère deux lignes brisées formées d’arcs de 
grands cercles, l’espérance mathématique sera encore pro¬ 
portionnelle à leurs longueurs, car, si l’un des éléments 
était double, l’espérance mathématique correspondante 
doublerait. 
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A la limite, celte conclusion sera encore vraie et, en géné¬ 
ral, l’espérance mathématique sera proportionnelle aux lon¬ 
gueurs s et s’ des courbes. Elle sera Kss'. 

Cherchons K. 

Supposons deux grands cercles: leur longueur commune 
sera 21 c, et ils se coupent en deux points ; l’espérance mathé¬ 
matique sera K x 4 tc 2 et, comme elle sera égale à 2 , 



Pour deux petits cercles, l’espérance mathématique sera 
ss r 

—£• S’il y a intersection, il y aura deux points d’intersec¬ 
tion. Or 

s = 2 irsin 0 , 
s'— 2 irsin 0 '. 


L’espérance sera 


27 rsin 0 x 27 rsin 0 ' 

27T 2 


2 sinô sinô'. 


C’est ce que nous avons trouvé plus haut, d’une autre ma¬ 
nière. 


88 . Supposons sur la sphère céleste un nombre N d’étoiles 
placées au hasard. 

Promettons à un joueur un franc pour chaque couple 
d’étoiles tel que la distance angulaire des deux étoiles, 
P et P', soit plus petite que y., Quelle est son espérance 
mathématique ? 

P' devra être à l’intérieur d’une certaine zone. La surface 
de cette zone est proportionnelle à sin s ^ . Pour y ~ n, la 



APPLICATIONS DIVERSES. l45 

surface est celle de la sphère entière; la probabilité est 
donc 


sm 




2 




Comme les étoiles sont au nombre de N, elles peuvent 

former —^——groupes de 2 . L’espérance mathématique 
est 


M(N — 1 ) 

2 


sin ! 


1 

2 


89. Considérons un système mécanique , dont les équa¬ 
tions sont mises sous la forme de Hamilton; n variables,. 
x y , Xï, .. .,x n , définissent la position du système ; n variables,. 
yuy it .. -,y n > définissent les vitesses. 

F étant une fonction donnée qui dépend des x et des y, 
les équations auront la forme 

dxi dF dyi dF 

dl dyi ’ dt dxt 

On connaît F, c’est-à-dire la loi du mouvement, mais on 
ne connaît pas les positions initiales. 

Représentons les valeurs des variables, au temps t = o, 
par Xyy x% ,..., x n et y ,, y% ,..., y 

Quelle, est la probabilité pour que ces variables aient cer¬ 
taines valeurs à un temps t donné ? 

Si je me donne la loi de probabilité pour que les variables 
aient les valeurs initiales ci-dessus, le problème devient 
déterminé. Je suppose que l’on se donne cette loi de proba¬ 
bilité pour les valeurs initiales. 
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90. Je suppose cette probabilité proportionnelle à 
k,dx\ dx\... dx% dy\ dy\... dyl, 
k étant une constante. 

On peut supposer qu’on ne sait rien sur les valeurs ini¬ 
tiales, et qu’on sait seulement que F est compris entre F t 
et F»; comme F = const. est une intégrale des équations du 
mouvement (c’est l’intégrale des forces vives), si la valeur 
initiale de F estcomprise entre F t et F 2 , F restera .comprise 
entre F t et F 2 . 

L’intégrale précédente, étendue à toutes les valeurs qui 
satisfont à 

F t <F <F 2 , 

sera égale à i. 

Si cette loi de probabilité est vraie pour les valeurs ini¬ 
tiales des variables, elle le sera encore pour les valeurs 
finales. 

Il suffit de démontrer que le déterminant fonctionnel des 
valeurs finales par rapport aux valeurs initiales est égal à 
l’unité. 

Soient a?', ...,y',... les valeurs des x, ...,y, ... au temps 
t'\ x, ..., y, ... leurs valeurs au temps t. Il n’y a qu’à éta¬ 
blir cette proposition pour t et d très voisins. 

Soit 

t’ - — t -i- s. 

Je vais, pour simplifier, examiner le cas de deuxvariables 
x et de deux variables y. 

, dx. dF 

* i = a?] + 6 __ = a;i + 6 _, 

, dF 

** = **"‘ _8 3£ î 
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et 


, dy x dF 

A=r'+ S dr=n- B dï? 


, dF 

?>=y*- s dF 2 - 

Le déterminant fonctionnel est 


i -+- s 


d*F 

d'F 

d* F 

œ-F 

dx i dyi 

dx j dy 2 

& dy\ 

dx x dy. 

d* F 

d i F 

d i F 

d î F 

dx x dy 2 

dx j dy 2 

dy 2 dy x 

Z dy\ 

d î F 

d* F 

£ 

d*F 

æ- f 

dx\ 


dx x dy x 

dx x dy. 

drF 

d z F 

d* F 

d* F 

dx j dx x 

S dx\ 

dx 2 dy\ 

1 S dx 2 dy. 


Je développe en négligeant le carré de e. Tous les élé¬ 
ments du déterminant sont infiniment petits du premier 
ordre, sauf les éléments de la diagonale. 

Tous les termes seront du second ordre au moins, sauf 
dans 


f \ f cP F \f d i F \f d* F \ 

v ^ 8 dyj ' v I " He dx 2 dy 2 ) y 1 e dx i dyJ\ I ® dx 2 dyj 

ou 



d î F 

dx x dy t 


;)■][■—( 


æ- f 

dx, dy 2 



c’est-à-dire i, aux termes près en e s . 


91. Adoptions de lois probables. — De tout ce qui 
précède, il résulte qu’il faut apporter un très grand soin à 
définir le choix de la loi de probabilité qu’on adopte. 

La probabilité pour que x soit compris entre x B et x t 
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s’exprime par une intégrale 


J i co(x)dx; 

ep (x) sera une fonction sur laquelle nous devrons faire des 
hypothèses pour connaître la loi de probabilité, mais, en 
général, on sera conduit à regarder ep(«) comme continue- 
En général, la probabilité que «satisfasse aune condition 
donnée dépendra du choix de <p; cependant, il n’en est pas 
toujours ainsi, et certains problèmes sont indépendants de 
la loi de probabilité . 

Exemple. — La probabilité pour que x soit incommensu¬ 
rable sera toujours égale à i, quelle que soit la fonction 
continue œ que l’on choisisse, et celle pour que x soit com- 
mensurable, toujours infiniment petite. 

92. Second exemple. — Soit une roue divisée en un très 
grand nombre de parties égales, alternativement rouges 
et noires; imprimons-Iui une rotation rapide. Lorsqu’elle 
s’arrêtera, une de ses divisions se' trouvera en regard d’un 
point de repère fixe : quelle est la probabilité pour que 
celte division soit rouge ou noire? 

Pour être complètement résolu, le problème exigerait la 
connaissance d’une fonction arbitraire; il dépendra de l’im¬ 
pulsion, de la vitesse angulaire initiale. La probabilité pour 
que cette vitesse soit comprise entre m 0 et M t est 



la fonction ep étant entièrement inconnue. 

D’un autre côté, la roue aura tourné d’un angle total 8. La 
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probabilité pour que d soit compris entre 0 O et 0 X est 

/ AO) de. 

A 

Nous ne savons rien non plus sur /(0). Néanmoins, la 
probabilité, pour que la division obtenue soit rouge, sera 

toujours très voisine de elle est donc indépendante 
de/. 

Je suppose que chaque division corresponde à un angles; 
je divise l’axe des abscisses en parties égales à s, et, par les 
points de division, je mène des ordonnées jusqu’à la ren¬ 
contre de la courbe 

r = /(A). 

Comme les divisions changent de couleur, je couvre de 
hachures les aires qui correspondent aux divisions rouges, 
par exemple. 

La probabilité cherchée sera le rapport de l’aire couverte 
de hachures à l’aire totale. 



Quelle que soit la forme de la courbe, quand le nombre 
des divisions augmente indéfiniment, ce rapport tendra 

1 

vers - ■ 

2 
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Soit, en effet, A l’angle maximum dont la roue peut tour¬ 
ner de telle sorte que 9 < A. Supposons la fonction f(9) 
continue et admettant une dérivée. Admettons de plus que 
cette dérivée ne dépasse pas un certain maximum, M. Donc 

|/'(0)|<M. 

Je divise A en n parties égales; soit e l’une d’elles. On a 

_ A 
n 

Considérons deux divisions consécutives : la différence 
des deux aires est plus petite que e (p .— p') où p et p’ dé¬ 
signent respectivement le maximum et le minimum de /(0) 
dans cet intervalle. Or (p.— p') est plus petit que 2 Me : la 
différence des deux aires est plus petite que 2Me°. 

Comme il y araires couvertes de hachures, il faut multi¬ 
plier par ^ pour avoir la différence des deux aires totales, 
ce qui donne Ms 2 n ou MAe. 

La différence des deux aires tendra donc vers zéro avec 
e et la probabilité sera bien i- 

Si on ne savait rien du tout sur ep ou sur/, on ne pour¬ 
rait rien calculer : c’est parce qu’on sait quelque chose que 
l’on peut entreprendre le calcul. Mais ici il nous suffit de 
savoir que /a une dérivée limitée. 

93. Troisième exemple. — Considérons un grand nombre 
de planètes, dont les orbites soient sensiblement circu¬ 
laires. Soient a le moyen mouvement de l’une de ces 
planètes, b sa longitude à un instant donné pris comme 
origine. Sa longitude / au temps t sera : 

l—at-^b. 
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La probabilité pour que a et b satisfassent à certaines 
conditions est 



da db. 


Je dis qu’au bout d’un temps très long les planètes seront 
également distribuées dans tous les signes du zodiaque. 

La probabilité pour que Z soit comprise entre des limites 
données sera donc indépendante de œ. 

Cherchons la valeur probable d’une fonction e iml : si 
m est différent de zéro, la valeur probable tendra vers zéro 
quand Z augmentera indéfiniment. Cette valeur probable est 
représentée par 



e tm(ai+b) y (a, b) dadb. 


Intégrons par parties; il vient 


/ 


gim{al+b) 

imt 



çim(al+6) 

imt 


—■dadb. 

da 


Si nous supposons seulement ep continue, les deux termes 
ci-dessus tendront vers zéro. 

Je demande la valeur probable d’une fonction périodique 
quelconque, / (Z). La formule de Fourier nous donne 

Chacun des termes de cette série aura pour valeur pro¬ 
bable zéro, sauf le terme constant A„. La valeur probable 
de/(Z) sera donc 

ZKJo 

Supposons qu’on ait 

o< Z û <Z 1 < 2 ir; 
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la probabilité pour que l soit compris entre l 0 et 4 est 

JL f 'dl— Z| ~~ Z ° . 

27T J, 2ir 

*0 

C’est la valeur probable d’une fonction / (l) égale à i si / 
est compris entre l 0 et /j, et à zéro dans le cas contraire. 

Si t est quelconque, quel que soit 9 , la probabilité sera 
sensiblement proportionnelle à l t — 4 ; la distribution des 
planètes sera uniforme 
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94. Nous allons aborder les problèmes connus sous le 
nom de probabilités des causes. 

Les problèmes que nous avons traités rentraient dans 
l’énoncé suivant: étant donné que telle cause est mise en 
jeu, quelle est la probabilité que tel effet en résultera? 

Les problèmes inverses sont: étant donné que tel effet 
s’est produit, quelle est la probabilité que telle cause a été 
mise en jeu? 

Le type de ces problèmes est celui de deux urnes dont la 
première contient beaucoup plus de boules blanches que 
l’autre : on a tiré une boule blanche, mais on ne sait pas de 
quelle urne; il y a plus de raisons de croire la boule sortie 
de la première urne que de la seconde. 

Pour donner une définition,-il faut faire une espèce de 
convention, comme au début de toute question de probabi¬ 
lité. 

Quand on compare le nombre des cas possibles au nombre 
des cas favorables, on doit avoir soin que tous les cas soient 
également probables. La convention qui repose sur des cas 
regardés comme également probables contiendra toujours 
un très large degré d’arbitraire. 

D’un jeu de 32 cartes, on tire une carte: on sait que c’est 
une figure; quelle est la probabilité qu’on a tiré un roi? 
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Avant l’événement, la probabilité était le rapport du 
nombre des rois au nombre total des cas possibles, soit ~ 
ou|. 

Après l’événement, le nombre des cas favorables est tou¬ 
jours 4 5 le nombre des cas possibles est diminué, c’est celui 

des figures, soit 12. La probabilité est devenue ou elle 

a augmenté. 

95 - Formule de Bayes. — Soient n causes différentes qui 
peuvent être mises en jeu, C t , C 2 , ..., C„; la probabilité 
pour que la cause C,-, si elle est mise en jeu, produise 
l’événement A est p £ . 

Si nous savions que est en jeu, nous pourrions affirmer 
que la probabilité de A est 

Il faut supposer que deux causes ne peuvent être mises en 
jeu simultanément. 

Avant l’événement, chacune de ces causes avait une pro¬ 
babilité a priori que je suppose donnée : la probabilité que 
la cause Ci soit mise en jeu était sr,. 

L’événement A a eu lieu: quelle est la probabilité que ce 
soit la cause G t qui l’ait produit? 

Énumérons- les cas possibles et les cas favorables, et, pour 
fixer les idées, considérons un exemple particulier. 

M urnes contiennent chacune Q boules; il y aMQ boules, 
soit MQ cas possibles, que je suppose également probables. 

Les urnes sont réparties en catégories G,, C 2 , ..., C„. 

Les urnes de la catégorie C, seront au nombre de üt,M; 
delà catégorie C 2 , au nombre de üt 2 M; ... ; de la catégorie C„, 
au nombre deisy„M. 

La probabilité a priori pour que la cause C„ soit en jeu 
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sera 

_ 

M _5TiZ - 

Dans les urnes, les boules sont noires ou blanches. L’évé¬ 
nement A est, par exemple, la sortie d’une boule blanche. 
La probabilité pour tirer une boule blanche de la première 
catégorie sera p t . 

Dans la catégorie Ci, ily aura p t Q boules blanches; dans 
la catégorie C 2 , il y en aura p 2 Q, ..., dans la catégorie C„, il 
y en aura p n Q. 

On a tiré nne boule blanche : on demande la probabilité 
pour que l’urne qu’on a choisie appartienne à la catégorie C,. 

Le nombre des cas favorables est le nombre des boules 
blanches de la catégorie C,, soit 

Le nombre total des cas possibles est celui des boules 
blanches 

-t-5T 2 /> 2 MQ -t-.. .-t-5T re /> re MQ. 

Le rapport de ces deux nombres est, par définition, la 
probabilité cherchée 

_ TàiPi __ 

Cil Pt -+- ÜS 2 p 2 -+-. . . -+- CT 


96. On peut dire encore : 

La probabilité que la cause C £ ait été mise en jeu, puis 
que, mise en jeu, elle ait produit l’événement A, est une 
probabilité composée. 

D’abord la cause C £ - doit être en jeu, et sa probabilité a 
priori est cr £ ; ensuite, mise en jeu, elle donne à Alaproba- 
bilitéjij. La probabilité composée est st//?;. 

Mais la question se pose autrement. 

Il faut que l’événement se soit produit, et ensuite qn’il 
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doive être attribué à la cause C*. C’est encore une probabi¬ 
lité composée. 

La probabilité pour qu’il se produise est 


. .-f-5T itPni 

la probabilité (si l’on sait qu’il s’est produit) pour qu’il soit 
dû à la cause Cf étant te, la probabilité composée pour que 
l’événement se soit produit et soit dû à la cause Cf sera donc 

trfaiPi-hlZzPz-h. • .-t- JSnPn), 

d’où 

æ — _ ?ZiPi _ 

®l/*l -t- 7 jT 2 Pz -t-. . . -t- UI n-Pii 

Ou bien encore, partons de la formule 

(B) (A si B) = (A) (B si A), 

démontrée au paragraphe 12. Écrivons 

(C/) (A si C/) = (A) (Cf si A). 

(C t ) c’est la probabilité a priori de la cause, sans savoir si 
l’effet A s’est produit : c’est vs t . 

(A si C £ ) c’est la probabilité de l’effet, sachant que la 
cause Cf a agi : c’est p £ . 

(Cf si A) c’est la probabilité a posteriori de la cause, 
sachant que l’effet A s’est produit : c’est x. 

La probabilité (A) est une constante, indépendante de Cf. 
L’égalité précédente exprime donc que (C, si A) est pro¬ 
portionnel au produit (C,) (A si Cf); c’est-à-dire que x est 
proportionnel à piUSi. 

97 . A l’écarté, un adversaire donne et tourne le roi; 
quelle est la probabilité que ce soit un grec? 
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Soient nji la probabilité a priori pour qu’il ne soit pas 
grec; w 2 , pour qu’il le soit. Dans le premier cas, la proba¬ 
bilité pour qu’il tourne le roi est 4; dans le second, elle est 1. 

O 

La probabilité a posteriori qu’on a affaire à un grec est 

TlTo 

Si l’on suppose nj 2 =:cîi, dans l’ignorance où l’on est de 

g 

l’honnêteté de son adversaire, cette probabilité esl de — 
Elle serait donc énorme. 

Fort heureusement, il est permis en général de supposer 
a priori, 

HT0 


98 . Dans une urne, dont la composition est inconnue, il y 
a N boules; nous effectuons p. tirages, en remettant chaque 
fois la boule tirée, et nous ne tirons que des boules blanches. 
Quelle est la probabilité pour que l’urne contienne « boules 
blanches? 

Soit vs n la probabilité a priori pour qu’il y ait n blanches 
et soit p n la probabilité pour qu’on amène p blanches. 



Après les tirages, la probabilité pour que l’urne renferme 

n blanches est donnée par la formule, et, après la suppres- 
t 1 

> commun aux deux termes de la frac¬ 
tion, elle est égale à 

sj„ nV- 

nr, nj 2 2!'--H.. .-HnTjiN! 1 


sion du facteur 
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99. Il faut connaîlre a priori si,, sj n , sur les¬ 

quelles on peut faire plusieurs hypothèses. 

Supposons, par exemple, que toutes les compositions de 
l’urne sont également probables, c’est-à-dire tous les xs 

égaux. Chacun d’eux vaudra car il y a N+i com¬ 

positions possibles de l’urne, en comprenant celle où il n’y 
a aucune boule blanche. La fraction précédente se réduit à 

nv- 


Supposons, en second lieu, que l’on ait placé successive¬ 
ment les N boules dans l’urne, les unes blanches et les 
autres noires, en laissant au sort chaque fois le soin de 
décider la couleur. 

La probabilité qu’on mettra une blanche sera chaque 
fois et la probabilité que, finalement, sur N boules, l’urne 
en contiendra n blanches sera évaluée par la formule 


où l’on fera 


ml 


«! (m — a) ! 


p a q n 


m — N, 


a = n, 


i 



ce qui donne 


N! 


n! (N — /i)! 


Ainsi la probabilité a priori m*, pour qu’il y ait n blanches, 
sera proportionnelle à un coefficient du binôme, et, dans 
l’expression de la probabilité a posteriori pour qu’il y ait n 
blanches, nous n’aurons qu’à faire les ni égaux à ces divers 
coefficients, 

_N! 

ni (N— »)!' 
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100. Le résultat sera très différent du précédent. 

Soit N très grand; 


sera un polynôme de degré ft-t -1 en N, que je puis réduire 
à son terme de degré le plus élevé, • 

La probabilité dans la première hypothèse deviendra ainsi 


/lî'-(fjt.-Hl) 

Nfi-t - 1 5 


3 

et, pour /X — 2 , par exemple, elle vaudra 

Dans la seconde hypothèse, évaluons d’abord ar n nV-, pour 
la même valeur 2 de p.. 


Tss^nï — n? 


NI 

n\ (N — n) 1 ' 


Évaluons ensuite le dénominateur 


ar 1 it l +aTî2t l -H...-j-aj N NP-. 


Pour cela considérons l’expression 

r -t- e^ajj -1- e 2;c aj 2 -t-... -h e^ar*-, 
qui n’est autre que le développement de 

(1 -ne*) 1 *. 

Je différentie deux fois par rapport à x 

i^aj, -+- 2 î e 2 *aj 2 -h ... -t- N 2 e Na: aT K . 

Il suffit de faire x — o pour retrouver le dénominateur 
que nous voulons connaître quand p. = 2 . 

Ce dénominateur est donc le double du coefficient de æ 2 
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dans le développement de (i -+- e x ) îi suivant les puissances 
de x\ or, en nous arrêtant aux termes en a: 2 , 

(I + e-)* = (*+* + aN (*■+• 7 + f )"’ 

c’est-à-dire 

„r Na: N(N —I) , Na: 2 *l 

2 ‘ s 

Le terme du degré le plus élevé en N à l’intérieur de la 
N 2 

parenthèse est a: 2 . Le dénominateur dont nous cherchons 

O 

N 2 

la valeur est donc approximativement le. double de 2 N -g-, 

O 

c’est-à-dire vaut 2 N-2 N 2 . 

Ainsi, dans la seconde hypothèse, la probabilité pour que 
l’urne contienne n boules blanches est 

N! zi 2 i 
nl(N —n)l N 2 2 «- 2 ’ 


elle est beaucoup plus petite quedansla première hypothèse. 
En effet, comme on l’a vu à propos du théorème de Ber¬ 
noulli, 

NI i 
n!(N — n)\ 2 n 

est très petit, sauf quand n et N — n sont sensiblement 
égaux à p et q, c’est-à-dire ici à i- 

101. Deux joueurs d’échecs ont joué n-\-m parties : le 
premier en a gagné n, lesecond m. Si m, on doit supposer 

le premier plus fort. 

Si une nouvelle partie s’engage, le premier aura plus de 
chances de la gagner. 
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Quelqu’un de bien informé pourra se représenter par p la 
probabilité pour que ce joueur gagne. Mais, pour moi qui 
n’ai jamais vu jouer cet individu, je ne connais pas ; je 
vais chercher à m’en faire une idée. 

La probabilité pour que p soit compris entre p 0 et p l se 
représente par 

S*pL 

/ f{p)dp. 


où la fonction f (p) est inconnue. 

La probabilité pour que p soit compris entre p et p -+■ dp 
sera a priori f (p) dp; c’est elle qui correspond à vs t . 

A la probabilité p t correspond 


( n -t- m) ! 
n ! m ! 


p n q ,, K 


La cause considérée est en effet que la probabilité de 
gagner soit/» pour le premier joueur. 

La probabilité que ce premier joueur gagne n parties, p 
étant sa probabilité de gagner à chacune des n-t-m parties, 
sera 


(n -+- m)\ 
zi! m! 


p n q m . 


Quelle est la probabilité a posteriori que p est compris 
entre p et p -t- dp ? 

Ici m ip t , en remplaçant g par i — p, est égal à 
p n (I — p )» ( } ' f(p) dp. 

La somme des ni ,p t sera 

f J >"( 1 ~P) m ' f(P) d Pi 


P. 


12 



CHAPITRE IX. 


j 62 

cette intégrale doit être prise de o à 1 , car la probabilité p 
est comprise certainement entre ces limites. 

On fait généralement l’hypothèse 

f(P) = I , 


faute d’autres renseignements. 

L’intégrale s’évalue alors simplement; elle devient 


(n -1- m )\ 
n\mï 



i — p) m dp. 


L’on est ramené à l’intégrale eulérienne de première 
espèce 


lî(/i + t, m- t-i) 


T(n -1- m -l- 2 ) 3 


les T sont ici des factorielles, et celte expression n’est autre 
que 

n \ ni\ 

{n-hm- 1 — 1 ) ! 


Ainsi l’intégrale qui représentait la somme des xs £ p e est 

simplement égale à et la probabilité a posteriori 

pour que p soit compris entre p et p+dp est 

... Cri + tïi -h 1) ! , . , 

y(p)dp =—— p n (i— p )>”dp. 


102. Quelle va être la probabilité pour que ce joueur 
gagne la partie suivante? 

Cette probabilité s’obtient facilement. La probabilité pour 
que p soit compris entre p et p -+-dp est © ( p) dp; la proba¬ 
bilité, lorsqu’il en est ainsi, de gagner la partie suivante 
pour le joueur est p ; en vertu de la probabilité composée, la 
réunion de ces deux conditions a pour probabilité/r<p ( p) dp. 
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On intégrera cet élément de o à i, d’où 


f P<?(p) d P • 
«^0 


Si l’on remplace y(p) par sa valeur, il vient 
(n -i- m -t-i)l P 1 


ni ml 


'■ Ç p ,l+i { i— p) m dp. 


C’est encore une intégrale eulérienne, et l’on arrive à 
(n -+- m -t- i) ! (n + i)l»îl 


ni ml (n -{- m -1 - 21 ! 


ou 


n -+- r 


n -h m- 1-2 


Si j’avais appliqué le même raisonnement à un jeu de 
hasard, je n’aurais pas eu le droit de supposer/(/?)= i. A 

priori, en effet, p devait égaler i- Donc / {p) devait être 

infini pour p — i- 


103. Représentons par N le nombre total des petites 
planètes; parmi elles, un certain nombre M sont connues. 
Dans une année, on en observe n parmi lesquelles m planètes 
connues. 

On demande la valeur probable de N. 

La valeur de N ne peut différer beaucoup de^^> mais 

cette évaluation au jugé ne suffit pas : il faut s’occuper de 
l’écart probablé entre le nombre véritable et le nombre 
probable. 

Voici comment nous procéderons : 
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En premier lieu, nous supposerons connue la probabilité 
pour que, pendant l’année d’observation, une planète exis¬ 
tante ait été observée; soit p cette probabilité: nous admet¬ 
trons qu’elle est la même pour les planètes connues et 
inconnues. 

Comme nous avons observé n planètes, la valeur probable 

de N semble, au premier abord, devoir être égale à —; mais 

il n’est pas possible que cette valeur soit tout à fait exacte: 
les nombres i, 2 , ..., N ont des probabilités, propres que 
j’appelle nr l3 w % , ..., et la valeur probable de N sera : 

ET, 2ZU2 “H. . . “H 


Si l’on suppose p donné, et tous les nombres 1 , 2 , ..., N 
également probables, on arrivera, comme nous le montre¬ 
rons, à ” ^ ^ pour la valeur probable de N. 

Ce premier point résolu, nous nous poserons un autre 
problème; nous avons supposé p connu, nous ne le sup¬ 
poserons plus, et nous déterminerons ensuite la valeur 
probable de N en fonction de m et M, ce qui nous donnera 

un résultat, très voisin de comme nous l’avons prévu 

m 

plus haut. 

104. J’appelle donc nr s la probabilité a priori pour qu’il y 
ait N planètes; la probabilité pour que, s’il y a ainsi N 
planètes, on en observe n dans l’année. 

La probabilité a posteriori pour qu’il y ait en tout N pla¬ 
nètes est une probabilité de cause; elle s’exprime par 

s px' 
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Comme première hypothèse sur les nt, supposons-lestous 
égaux; la formule précédente se réduit à 


Pn 

Zps" 


Pour calculer pu, appliquons le théorème des épreuves 
répétées. La probabilité que, sur N planètes, ou en obser¬ 
vera n dans l’année est 


Pn= 


N! 


ni (N — n)\ 


p n q' 


Üt-B 


p étant la probabilité pour qu’une planète, si elle existe, soit 
observée; q la probabilité pour qu’elle ne le soit pas. 

n est une valeur constante : c’est la plus petite que puisse 
prendre N. Faisons croître N indéfiniment. 


2p N =P n -t-~■ -p n q 


(n •+- i) {n -+- 2 ) 


I ‘ ' 1.2 

=P"(i — q)~ in+1) = ^{p, q). 


P n ? 


Si j’introduis maintenant la relation p = i — q 


2 Px—pKp-(n-i-l) — L. 

Avec l’hypothèse faite sur les m, la probabilité pour qu’il 
y ait N planètes est donc pp^. 


105. La valeur probable de N est 


2 N p y 

^Px 


Il est u n p eu plus simple de calculer la valeur probable de 
N — n, soit 


.S(N — re)/>K 
2px 
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Posons 

A - N! 

n\ (N — n)1 5 

alors 

'Lp^—'Lkp' 1 q s ~' 1 , 

2 (N — 7i)^ N =:2A/i re (N — n)q^~ n . 

Pour évaluer le second membre il suffit de différenlier 
F(/j, y) par rapport à q, et de multiplier le résultat par q, 

q =p n qi”■ + O (i - q )~ (n+1> ; 

faisons après cette différentiation i — Ç=p- Il reste 

{n + i)q 

P 2 

En vertu d’une précédente démonstration, cette expres¬ 
sion est égale à DA/)' 1 (N — n) q*-’ 1 . Comme d’autre part 

la valeur probable de N — n est 

(n-t-i)g 

p 1 _ {n-j~i)q 

I ~ P 

P 

Par suite, la valeur probable de N est 

| r _ _ n + g 
P P 

Cette quantité diffère très peu de -, comme il était prévu. 
En effet 

re-i- q _zi -i-1 

P ~~P ’■ 
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106. Considérons maintenant la valeur de p comme 
inconnue; je supposerai qu’on veuille connaître quelle est 
la probabilité pour que p soit compris entre p et p 4- dp. 

Ici, la probabilité a priori , vs j, pour qu’il en soit ainsi, 
sera 

&t=AP)dp, 


oiif(p) est une fonction inconnue de p. 

pi sera la probabilité pour que, si p a une valeur déter¬ 
minée, l’événement observé se produise, c’est-à-dire pour 
que, sur M planètes, on en observe m. 


pr- 


M! „ „ 


ml (M — m) ! ‘ 


Toutes les valeurs possibles de p sont comprises entre o 
et i. On a donc 


**iPt 

IvtSiPi 


Mi 

m\ (M — m) I 


P m q VL ~ m f{p)dp 


M! 

m \ (M — m)\ 



p" l q VL ~ m f{p)dp 


Quel est le nombre probable pour N? Nous multiplierons 
le numérateur par et nous intégrerons de o à i. Cette 

valeur probable N est égale à 

P m g u ~ m AP ) d P 
f p" l g K ~ m Ap) d P 

J n 



Ce résultat dépend de/Q> ) ; supposons cette fonction égale 
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, . n -+- q n -+- i 

a 1 , et remplaçons aussi par ——-i. 

f p m q^~ m dp — Ç p' a q il ~ m dp 

ïvr _ ''O f* Jo 


N = 


f p m q M ~ m dp 

•'O 

(/i-l-i) C p m ~ l q il ~ m dp 
«/0 


N = 


Posons 


f p/n qA—m dp 

J 0 


N = (/n-i)J — i. 


J est le rapport de deux intégrales qui sont encore des 
intégrales euiériennes. 


r(»i) T(M — m- 1-1) 

j_ T(M-4 -i) _ r(M + 2)T(m) 

r(wt + i) T(M — m + i) — T(M-Hi)r(/n-t-i ) 5 
T(M -i- 2) 

T_M + I 

J —-J 

m 

et par conséquent 

ÿ_ («+i)(M+r) f 
m 


n 

Cette valeur est très voisine de -—> ainsi que nous l’avons 

m 


annoncé. 
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107. Je suppose qu’on ait effectué différentes mesures 

5 * • * ) 3 e n 

d’une même grandeur : quelle est la probabilité pour que la 
véritable valeur soit comprise entreset^ + dzl 

11 faut introduire une loi des erreurs. Je suppose que la 
véritable valeur de la grandeur à mesurer soit z; quelle est 
la probabilité pour que le résultat de l’observation soit com¬ 
pris entre æ, et æ 1 -t-dx 1 ? Jepourrai dans tous les cas repré¬ 
senter cette probabilité par 

dæ x cp(;zj, z). 

Cette loi des erreurs étant admise par convention, 
quelle est la probabilité pour que z soit compris entre z 
et z -j— dz ? 

C’est un problème de probabilité des causes, et nous 
allons calculer 

ŒiPi 

2&iPi 

ts £ est la probabilité a priori pour que z soit compris 
entre s et s -+■ dz; cette probabilité sera représentée par 

nr<= (f'(-) dz. 
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étant une fonction qui dépendra de ce que nous savons 
sur z. 

Pi est la probabilité pour que, à supposer que la quantité 
observée soit z, les observations aient donné des résultats 
compris entre 

ôi/j et îCj i dcc^y ûi7, et Æ 2 —H dx<i^ • » «, ut l dx^. 

La probabilité respective de ces événements est 
dXi (pC#!, z), dx 2 a(x 2 ,z), dx n q>(x„., z). 


Pi est la probabilité pour que tous ces événements se 
soient produits à la fois; comme ces événements sont indé¬ 
pendants, c’est une probabilité composée 

Pi — dx^dx^ ... dn n cp z ) cp(Æ? 2 > ■£*)••• cp-0* 


La probabilité a posteriori cherchée a pour numérateur 
dzdæ l dx%.. .dx, t ty(z) ^(x !f z) <p(x t , z):. .cp(a:„, z). 


Pour obtenir le dénominateur husipi, il faut intégrer cette 
expression par rapport à z seulement. Dans le quotient, 
dæ i, di Tj,, ..., dx n sont des constantes qui disparaîtront, et 
il restera pour la probabilité 


L 


dz'ty(z)y{xi,z)<?[x u z).. .<p(x„, s) 

-J- os 

dz (—) cp(a?i, s) s)...q>(^? n , z ) 


108. Cela ne nous apprendrait pas grand’chose si nous 
n’avions aucune donnée sur <p et t}>. On a donc fait une hypo¬ 
thèse sur <p, et cette hypothèse a été appelée loi des 
erreurs. 

Elle ne s’obtient pas par des déductions rigoureuses; plus 
d’une démonstration qu’on a voulu en donner est grossière, 
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entre autres celle qui s’appuie sur l’affirmation que la pro¬ 
babilité des écarts est proportionnelle aux écarts. Tout le 
monde y croit cependant, me disait un jour M. Lippmann, 
car les expérimentateurs s’imaginent que c’est un théorème 
de mathématiques, et les mathématiciens que c’est un fait 
expérimental. 

Voici comment Gauss y est arrivé. 

Lorsque nous cherchons la meilleure valeur à donnerai, 
nous n’avons pas d’autre ressource que de prendre la 
moyenne entre x u x 2 , ..., x n , en l’absence de toute con¬ 
sidération qui justifierait un autre choix. Il faut donc que 
la loi des erreurs s’adapte à celle façon d’opérer. Gauss 
cherche quelle doit être cp pour que la valeur la plus pro¬ 
bable soit la valeur moyenne. 

109. Si dz est constant, la probabilité pour que z soit 
compris dans l’intervalle dz est 

<K S ) ?(®i. s ) 9 (^ 2 , 2 ).. .y(x n , z) ds. 

La valeur la plus probable sera celle pour laquelle cette 
fonction sera maximum. Supposons ce maximum atteint 
quanu s est la moyenne. 

Gauss a d’abord égalé la fonction à 1 , puis il a admis 
que w(x lt z) était de la forme <p(z — x 2 ). 

Quelle doit être alors la fonction cp pour que 

cp(z x l ) cp(z — x 2 ).. .cp(z x n ) 

soit maximum avec cette valeur de s? 

Égalons à zéro la dérivée logarithmique de l’expression 
précédente par rapport à z, 

ÿ{z — x t ) <p'(z — x 2 ) [ | <s’(z — x n ) _ q 

œ(s—* 1 ) cp (z — x 2 ) a>(z — x a ) 
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Je pose 


g/(s —a;,) 

? (* —*i) 


F («a?i )- 


L’équation à vérifier devient 

F(aq) -+- F(a: 2 ) . .-t-F (x n ) = 0. 

Cette condition devra être réalisée toutes les fois que 


x t -t- x 2 -+-... -t- x n — nz. 

Je vais donner à x t , x ît x n des accroissements 
dx u dx 2 , ..., dx, t ; z restant constant, la somme des x 
doit rester coustante et l’ou doit avoir 

F' (a^) dx t -{-¥' (x 2 ) dx 2 -{-. ..+ F'(æ„) dx n =o, 
dx t -h dx 2 -t-_-t- dx n — 0 . 


Ces deux équations doivent être identiques, d’où 

F(® l )=F'(a 1 )^=--=F'(*,), 

c’est-à-dire que F'(a:,) est une constante que je représente 
par — a. 

F (^ 1 ) —— fit (•« — æ-i) -t- b, 
et 

logcp(.s — Xi) = — Z a Xi — -+- b(s — aq)-t-c. 

Déterminons les constantes a, b, c. 

F(a?i) -j-FC^j.) . .-t-F(a: K ) = 2a(z — x,)-i-nb — o, 

■x,-f- x 2 -h.. ,-hx n — ns — — 2i(z — x x ) — o. 


Comme ces deux équations doivent être identiques, on a 

b — o, 
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et l’on peut écrire 

ntz — .T t \î 

<p(s — x l ) = e c e 2 ; 

c se détermine par la condition 


En posant 


on trouve 



x l )c/æ l = i. 


■— a — ik, 
s — as x = y. 


9(y) = 



e- h y-. 


110. J. Bertrand présente les objections suivantes : 

La fonction cp.a été prise sous la forme <p(s — a:,), taudis 
qu’en réalité elle devrait être cp(s, a^). De plus, on a fait 
=i, et l’on ne peut l’affirmer a priori. 

Autre objection : La moyenne est-elle la valeur la plus 
probable ou la valeur probable? Ce n’est pas la même 
chose. 

Supposons qu’une certaine grandeur x puisse prendre 
pour valeur 

i, 2 , ..., n — i ou n, 

et que chacune de ces valeurs ait pour probabilité 
Pu Pu • • • > Pu 

de telle sorte que 

.. + pâ=T. 

La valeur probable de x sera par définition 
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La valeur la plus probable de x sera celle qui correspond 
au plus grand des nombres p. 

Dans le cas du problème des erreurs, la valeur probable 
de z est donc représentée par le rapport 

f" 1 "” 

1 àsffs) cp(aû, z) cp(a; 2 , z).. s) 

«''—ao _ 

1 ds’if(z) <?(«!,s) <s?(æ t ,z) ... y{x n , s) 

«^ — 00 

J. Bertrand dit que Gauss aurait dû chercher, non pas la 
condition pour que la moyenne soit la valeur la plus pro¬ 
bable de z, mais la condition pour que la moyenne soit la 
valeur probable de z. 


111. Ôn peut chercher à s’affranchir des hypothèses que 
nous avons faites, à savoir que <p(x t ,z) était de la forme 
<p(s — et que (f'C- 5 ) était égale à i; on peut se demander 
quelle forme ou pouvait donner à ces deux fonctions pour 
que la moyenne arithmétique de x u x 2 , .x n fût bien la 
valeur la plus probable de z. 

En d’autres termes, cette moyenne arithmétique, comme 
nous l’avons déjà dit, doit rendre maximum 

<\>(z)y(Xi, z)( ? (x i , z ).. ,cp(a:„, z). 

Quand il y a maximum, la dérivée logarithmique est 
nulle; c’est-à-dire que si l’on pose 


ou doit avoir 


yiixuz) 

<p(^i ,z) 


— F(^i, z)j 


^'(g) 


= x> 


$(x u z) -t-F(a: 2 , z) -t-...-t-F(Æ- re , s)-t-x = o. 
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Cette égalité doit'être satisfaite par la valeur de z que 
définit l’équation 


*4* «2/*2 “4“ ... “4“ Osji — HZ, 


Je vais donner à x x , x 2 , ..., x n des accroissements 
dx lt dx 2 , .... dx n . Je suppose que z ne change pas et que 
la dernière égalité continue à être satisfaite; % est alors 
une constante, et 


dS{x x ) 

dx l 


dx x 


+ dF{x 2 ) 
dx 2 

dx x 4- dx 2 


dx « 


dx ; 

. 4- dx n = o. 




Ceci ne peut avoir lieu que si 


Donc 


dF{x x ) _ dF(x 2 ) _ _ dF(x n ) 

dx x dx 2 " ’ dx n 



où k! est fonction de z seulement; et 


F = A'x t 4 - B', 


B' étant aussi fonction de s seulement. 

La condition à remplir devient 

A’ (34 4- X 2 4". . . 4- x a ) 4~ nB / 4- % ^ O, 

c’est-à-dire 

ti ( k! z 4— B r ) 4- % -- 0. 

Cette relation doit être satisfaite quels que soient s et n; 
donc 

7 . = °> 

c’est-à-dire que est cousiant, et que 


A's-t-B'=o. 
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Voilà ce que deviendrait l’analyse de Gauss si l’on voulait 
la reprendre en tenant compte de la première observation 
de J. Bertrand. 

112. De 

F(^], z) = A'#! 4 - B', 
on déduit aisément 

logtp(^,, z) — A.«, - 1 - B -t- lo g9(x,). 

log9(x t ) représente une fonction de a;, seulement; A elB 
sont des fonctions de z, admettant des dérivées A! et B', 
telles que 

A.'z -t-B'=o. 

Ainsi 

z) — 9(x t )e kXl ~ t ' B . 

Tel serait le résultat sans autre condition que le postulat 
de Gauss sur la valeur moyenne. 

Il entre encore deux fonctions arbitraires, 9 et A; B est 
lié à A par une relation. 

113. Une autre objection a été faite à Gauss. 

La quantité qu’on doit prendre pour z, ce n’est pas la 
valeur la plus probable, c’est la valeur probable. En effet, la 
valeur la plus probable est celle qui correspond à la plus 
grande valeur de p ; elle peut être très différente de toutes 
les autres', tandis que celles-ci peuvent se grouper très près 
l’une de l’autre, ce qui donne fort à croire qu’elles diffèrent 
très peu de la véritable valeur. Elles n’interviennent pas 
dans la valeur la plus probable, tandis qu’elles contribuent 
toutes à la valeur probable qui est par définition 


■î-'i Pi -t- X 2 p 2 -t-... 4- x n p n 
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La valeur probable de 2 est 


/ -s'K- 5 ) ?(«!, s)cp(a; 2 ,.zr).. -y{Xn,z)dz 

J -CO 

___ _ 
/ 'K 5 ) ?(« 2 , s) ■ • • <pO«> -) dz 


Les deux quantités sous le signe J' ne diffèrent que par 


le facteur .s qui figure en haut.j 

Il faut choisir ^ et 9 de façon que cette valeur probable 
soit la valeur moyenne 


■•g] 4 - a;, 4 -... 4- x n 
n 


114. Pour cela, je suppose que p observations aient 
donné le résultat a?,; p autres, le résultat ...; enfin, 
les p dernières, le résultat x n . C’est un même nombre p, et 
je le suppose très grand. 

Les deux intégrales porteront sur p facteurs égaux à 
z), sur p facteurs égaux à cp(a; 2 , z), ..., sur p facteurs 
égaux à y(x n , s). 

Je pose 

<& = <o(x l , s) <p (x it z).. ,y(x„, z). 


II s s agit de vérifier que 


J * + (*) 
J <K*) 


®Pdz 


®Pdz 


CC ( -J— -J— . . . -J— 0C n 

n 


Cette égalité devra avoir lieu quelque grand que soit p . 
P- i3 




x 7 8 
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Si, au lieu de deu X J* nous avions le rapport de deux 
nous aurions à considérer le rapport 

#iX^4- et 2X5 4-... 4- Æ n X^ 

ÔjXj 4 - 62X2 4 -. . - 4 - 6 re X£ 


où les Xi, X 2 , ..X B seraient fonctions des x u tc 2 , .x n 
et les a u a 2 > • • •> «n» b u b 2 , .. .y b n des fonctions de -s. 

Je suppose positives toutes les quantités X. Quelle est la 
limite de ce rapport quand p croît indéfiniment? Soit X,; la 

plus grande des quantités X : la limite sera —■ 

En effet, ce rapport peut s’écrire 



X 

Toutes les fractions =^sont plus petites que 1 , sauf une 
Xi- 

seule, celle qui correspond à k = «'.Donc, quand p augmente 

indéfiniment, le rapport considéré a bien pour limite 
» 

Etendons ce résultat aux intégrales 



<S>p dz 


et 



dz ; 


<Pi(-s) joue le même rôle que a h et <p 2 (.s) que b t . Quelle est 
la limite du rapport de ces intégrales? Soit s 0 la quantité 
qui rend $ maximum. Cette limite sera 

9lCSo) 

?2 (^o) 


*0<M-Sq) 

+(* 0 ) 


c’est-à-dire ici 
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Cette quantité z 0 doit être la moyenne arithmétique. 

115. Nous revenons à la même question que précédem¬ 
ment : $ doit être maximum quand « est la moyenne 
arithmétique. Nous connaissons la condition pour qu’il en 
soit ainsi; c’est 

<o{x 1 ,z) = d{x i ) 

les dérivées A' et B' des fonctions de z, A et B, étant liées 
par 

A'z 4 -B'=o. 

Quand on suppose que <p dépend seulement de la diffé¬ 
rence z — x u sa dérivée logarithmique par rapport à z, 

A'^-t-B' 

doit être du premier degré en .c — x t ; alors 
cp (z — x t ) = Ce 4 ' ( * — 

A' et 9(x 1 ) sont constants. 

Dans le cas général, c’est-à-dire quand on ne suppose pas 
que <p dépend seulement de « — x,, il reste pour 2 ) 
trois fonctions arbitraires à déterminer : d’abord que 

l’analyse actuelle ne permet plus de déclarer constant 
comme dans le calcul de la valeur la plus probable; 
puis 9(Xi); puis A. Quant à B, il est lié à A par une rela¬ 
tion. 

116. Il s’agit de déterminer un peu plus complètement 
ces fonctions arbitraires. 

Je vais supposer p observations donnant pour résultat x± : 
la moyenne arithmétique sera x t ; alors 


$ = 0(a; 1 )e Aa: ‘ +B 
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et l'on doit avoir 


d’où 


J" sty(z)<S?P dz — x l 'j' <ty{z)Qp dz\ 

Qp J' t}>(s) e p(A*i-t-a> dz — o. 


Cette relation doit être satisfaite quels que soient p et x t . 
Qp a pu sortir du signe J* puisqu’il ne contient pas z, et 
nous ne pourrons le déterminer par cette condition. 


117. Cherchons ^(s). 

k.Xi -t- B est une fonction de z qui atteint son maximum 
pour z~Xi‘, soit u\ ce maximum. Je puis donc poser 

A«i+ B = u-l — u 2 ; 

u sera réel. 

De même 

J {z — Xi)^{z)dz 


est une intégrale qui est toujours positive et ne s’annule 
que pour z = Xi; je puis donc la poser égale à p 2 , d’où 

A.X 1 4 - B = «jj — u 2 , 

(5 — x^ dz — zvdv. 


Pour achever de définir « et p il faut s’en donner le signe, 
car nous avons seulement défini u 2 et p 2 . Nous conviendrons 
de donner à u et à p le signe 4 - si a est plus grand que Xi 
et le signe — dans le cas contraire; u et p sont donc tou¬ 
jours de même signe. 

D’ailleurs 


« 2 = A(a; 1 )a; l 4-B(a; 1 ). 
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L’intégrale examinée devient, en faisant sortir une con¬ 
stante, 


/ 


2 p dp e~ pu '. 


Je puis supposer p exprimé en fonction de u, 


et alors 


ip dp = f(u) du, 



e~P u ‘ du 


doit être nulle, quel que soit p, lorsque les limites sont 
— oo et 4 - oo. 


118. Cela ne peut arriver que si /(«) est une fonction 
impaire. En changeant u én — u, on aurait 


d’où 



— u) e ~ pu1 du = o, 



4- /(— «)] e~P u ' du = o. 


Cette relation doit être vraie quelque grand que soit p . 

Si /(«) est impaire 

/(«) -*-/(—«) = o. 

Si f{u) n’est pas impaire, je développe suivant les puis¬ 
sances croissantes de u. L’intégrale ne pourra être égalée à 
zéro quel que soit p. 

En effet, 

f{u) 4-/(— a) = a« 2ffi 4-(3« 2n+2 4-_ 


Je vais poser 
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l’intégrale va devenir 



+ 


|3£2n+2 

pn+i 



et elle doit être identiquement nulle. 

1 

Si nous multiplions par p 2 tous les termes, le premier 
ne contiendra plus p, et les autres le contiendront encore; 

i . 

l’intégrale, au facteur près p 2 , se réduira sensiblement 
pour p très grand à 

ccf (H* g** dÇ, 


qui n’est pas nulle. 

Donc/(«) doit être fonction.impaire de u. 


119. On a posé 

(z — x l )ty(z)dz = f(u)du. 

Différenlions, en considérant x x comme constant, l’autre 
équation en a, 

A«, + B = «J — « 2 ; 

il vient 

dz{A'Xi-\-W) ——2 udu\ 
or, en tenant compte de la relation 
A'5 + B'=o, 

A' Xi + B' = A’ Xi — A’z — — A'(z — Xi). 

Donc 

A (z — Xi) dz — lu du ,, 

d’où 

^(g) _ /(«) 

A! 2 u 
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est une fonction paire, donc ne doit pas chan- 

IL A 

ger quand on change a en — u. 

Or ^ 7 ^ n’est pas une fonction de u, mais une fonction 

de z indépendante de æ l : je dis qu’elle doit se réduire à 
une constante. 

En effet, je considère deux valeurs quelconques de z, 
Sj et z 2 , pour lesquelles A et B prennent respectivement 
les valeurs A, et B,, A 2 et B 2 ; je vais choisir de façon 
que 

A i&x + Bi •— A 2 .27 j B 2 ; 

«J — u 2 reprendra alors la même valeur pour z i et z 2 . 

Donc — qui n’est fonction que de u- reprendra aussi la 
même valeur et Pou aura 


<Ksi) _ KM. 

A'(îq) A'(s 2 ) 


Donc 


41f) 

A' 


est constant. 


120. Ainsi la manière la plus générale de satisfaire au pos¬ 
tulat de Gauss (modifié conformément à l’objection de 
J. 'Bertrand, à savoir que la moyenne est la valeur pro¬ 
bable) se traduit par 


z)-—9(x 1 )e 


rf ♦ 


(3)(s— æ t )dz 


121. Considérons 

3/j —37, -H ... 

n j. 

si 

Il = ÿ(z)y(tc ,, u) cp(a: 2 , z). . .cp(Æ«, z)dz. 
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Je dis que cette intégrale est nulle, c’est-à-dire que la 
moyenne est la valeur probable. 

Je vais poser 


et 


X^ -{— X% ~ï~ • • • ■ 4 — 
n 


— x. 


<?(«!, z) y{x 2 , s). . .tp(æ n , z) = d(x t ) d(x 2 ). . ,ô(x n )e p . 


L’exposant P peut s’écrire 

P =—J <K-s)[(s— 4 -(æ— x 2 )-h.. .-h(z — x n )]dz, 


c’est-à-dire 

P =— nj" — x)dz. 


Il reste donc à démontrer que l’intégrale suivante est 
nulle : 

J'd^Xi) ô(x 2 ).. .9(x n ) (z —a;)^(5)e x)i “ dz. 

Si nous posons 

J (.s— x)<i/{z)dz = u 2 , 

d’où 

(z — a;)t}>(.c) dz = indu, 
l’intégrale envisagée se réduit à 

iQ{x l )Q{x 2 ).. ,8(x n ) J' ue~ nv? du. 

Elle est nulle quand « varie de — oo à -+- 00 . 


122. La fonction 9 dépend ainsi de ij/, et ^ dépend de la 
connaissance que nous pouvons avoir a priori de la pro¬ 
babilité relative à z. 
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a) dépend de l’habileté de l’observateur et de la probabilité 
a priori pour qu’il se trompe. 

Il n’y a aucune raison pour que ces deux probabilités a 
priori dépendent l’une de l’autre. La seule hypothèse rai¬ 
sonnable est donc de supposer ^ = i pour retrouver la loi 
de Gauss. 

123. Reste Q{Xi). 

Rien n’oblige à supposer cette fonction égale à i. On sait, 
par exemple, que certaines observations, telles que les 
observations méridiennes, sontsujettes à une cause d’erreur 
particulière que l’on a appelée l’erreur décimale. 

Quand on mesure une quantité, quand on effectue une 
lecture, on évalue le résultat jusqu’à un certain ordre 
d’unités, et le nombre qu’on donne est celui qui se rap¬ 
proche le plus, dans cet ordre, de la grandeur qu’on veut 
connaître. 

Or on a remarqué que chaque observateur semble affec¬ 
tionner certaines décimales; on exprimera analytiquement, 
ce fait en disant que est périodique, et qu’elle devient 

maximum pour ces décimales. 

424. Quelle opinion faut-il avoir de ce postulat de Gauss? 
Dire qu’il est admis par tout le monde, ce n’est pas le justi¬ 
fier, car tout le monde n’a peut-être pas une connaissance 
suffisante de ce qu’est une loi des erreurs. 

Si nous avions appliqué les mêmes raisonnements à z 2 , 

„ x 2 4 - x\ 4-. . .-t- x\ 

- " 1 9 

n 

la valeur adoptée pour z eût été 
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On peut se trouver en présence d’une série de mesures 
portant sur le carré d’une grandeur inconnue, et, d’après le 
postulat, il faut prendre la moyenne desn quantités directe¬ 
ment observées. 

J. Bertrand donne comme exemple une aiguille qui indi¬ 
querait le carré de l’angle mesuré. Devrait-on prendre la 
moyenne des lectures de l'aiguille, c’est-à-dire la moyenne 
du carré des angles, ou la moyenne des angles eux-mêmes? 
Aucune de ces deux solutions ne serait raisonnable. La 
mesure de cet angle comporte deux erreurs : i° l’erreur de 
visée, et l’erreur de visée probable serait l’erreur moyenne 
de l’angle; a 0 l’erreur de lecture, et l’erreur de lecture pro¬ 
bable serait l’erreur moyenne du carré de l’angle. 

125. La règle de la moyenne semble donc dénuée de sens. 
Pourquoi cependant ne nous trompe-t-elle guère? Pourquoi 
est-il légitime de prendre la moyenne? C’est , au fond, parce 
que les erreurs sont très petites. 

Si, au lieu de z, je mesure f(z), et que j’applique à f(z) 
le postulat de Gauss, 

f( z \ — f( x ' 

J’aurai, puisque x i est très voisin de z, 

/(^i) =/(*) -+- («t— *)/'(*), 

et de même avec x 2 , ..., x n . J’en déduirai 

/(«)=/(«) 

c’est-à-dire 

—s) = o 
ou 

nz — x t -+- x 2 -+-... -h- x n . 
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On arrive donc au même résultat, qu’on ait mesuré direc¬ 
tement la grandeur z ou une fonction quelconque f(z ) de 
cette grandeur. 

Voilà, en somme, pourquoi on a le droit de prendre la 
moyenne. 


126. I)’un autre côté est-il si exact de se borner à prendre 
la moyenne? Ce principe est-il si incontesté? 

Sur « observations, s’il arrive que « — i soient très voi¬ 
sines l’une de l’autre et que la « îème en soit très éloignée, 
prendra-t-on la moyenne? Le résultat serait très différent 
du centre de gravité des n —i premières observations, des 
n — 1 bonnes observations. Certains expérimentateurs écar¬ 
tent la « îême : il y a eu, disent-ils, accident, et cette obser¬ 
vation est mauvaise. 

Mais alors la valeur prise n’est plus la valeur moyenne : 
on a eu une raison de rejeter le postulat. 

Quand on adopte la loi de Gauss, l’erreur probable sur la 


moyenne est-^; de sorte qu’en multipliant les observations 

yn 

on devrait aboutir à une précision de plus en plus grande. 
Et cependant, quand on mesurera un mètre lin million de 
millions de fois, sans vernier, on ne le connaîtra jamais à 
un millième de millimètre près, à i micron près. 

Cela s’explique d’ailleurs : pour de très petites gran¬ 
deurs observées, on ne peut répondre de rien, il n’y a pas 
davantage de raisons pour que l’erreur soit comprise 
entre o et i micron que pour qu’elle soit comprise entre r 
et 2 microns. 


127. Dans le Chapitre XI, j’établirai encore le théorème 
suivant : 
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Quand on prend la moyenne, le carré de l’erreur commise 
est 


CC j —{— • • • —f— 


*)’ 


Quelle que soit la loi des erreurs, Gauss démontre que la 
valeur probable de cette expression tend vers zéro quand n 
augmente indéfiniment. 

Gela justifie le choix de la moyenne : elle devient de plus 
en plus probable à mesure que n augmente, sans être la 
plus probable. 

Mais cette manière de justifier le choix de la moyenne 
indépendamment de la loi des erreurs est, pour ainsi dire, 
une réfutation du raisonnement de Gauss exposé plus haut, 
puisque ce raisonnement prétend établir qu’une certaine loi 
très particulière est la seule qui puisse justifier l’emploi de 
la moyenne conformément à la pratique universelle. 

Il est assez étrange que cette réfutation soit due à Gauss 
lui-même. 
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128. Nous allons adopter la marche suivante : 

i° Nous chercherons quelle est pour la loi de Gauss 
l’expression de la valeur probable de la puissance p' ème de 
l’erreur; 

2 0 Nous montrerons que cette loi est la seule pour laquelle 
cette valeur probable ait cette expression; 

3° Nous chercherons pour une loi quelconque l’expres¬ 
sion de cette valeur probable; 

4° Nous chercherons encore cette expression quand l’er¬ 
reur résultante est la somme de plusieurs erreurs partielles, 
indépendantes les unes des autres; 

3° Nous chercherons ce qu’elle devient quand les erreurs 
partielles sont très nombreuses et très petites; 

6° Retrouvant ainsi la même expression qu’avec la loi de 
Gauss, nous conclurons que la loi de Gauss doit être vraie 
toutes les fois que l’erreur résultante est due à l’accu¬ 
mulation d’erreurs très petites, très nombreuses et indé¬ 
pendantes; 

7 “ Nous retrouverons le même résultat par une autre 
voie. 

129. Soit ^ la quantité à mesurer. 

La probabilité pour que le résultat de la mesure soit 
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compris entre x t et x t 4 - dx , peut être représentée par 
<p(x t , s)dx i . 

Gauss, nous l’avons dit, suppose que <p ne dépend que 
des — x t ; la probabilité sera alors 9 (s — x t ) dx l ; de plus, 
il suppose qu’il n’y a pas d’erreur systématique, c’est- 
à-dire que 9 est une fonction paire et ne change pas quand 
on y substitue x t — s à s — x t . 

Soityj l’erreur : 

7i = «i — *• 

La probabilité est 9 (y,) rfy,. 

Nous aurons à considérer la valeur probable de y t , et, 
plus généralement, celle de yf ; ce sera 

J—» 

Comme <p est une fonction paire, si p est impair, cette 
intégrale est nulle. 

130. On peut faire deux observations, y, et y 2 , et avoir à 
considérer la valeur probable d’une fonction de y, et y 2 , par 
exemple yf >y“ 5 . 

?(ji) est la probabilité pour que la première erreur soit 
comprise entre y, et y, - 4 - dy^ ; a(y 2 )la probabilité pour que 
la seconde erreur soit comprise entre y 2 et y 2 4 - e?y 2 . 

La valeur probable de yf'y? 5 sera P ar définition 

Jff? 1 Y?* ? (7i ) ? ( J 2 ) dy l Jy 2 , 

les intégrales étant prises de — 00 à 4 - 00 par rapport à y t 
et par rapport à y 2 . 
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Comme la fonction sous le signe 



est le produit d’une 


fonction de y 2 par une fonction de y 2 , et que les limites sont 
constantes, cette intégrale double sera le produit de deux 
intégrales simples 


J' y?l ? ) dyi J' y™* <?(/ 2 ) dy 2 . 


Ceci montre que la valeur probable du produit est le pro¬ 
duit des valeurs probables des facteurs. 

11 faut que les deux facteurs soient différents : la valeur 
probable.de yf, par exemple, ne serait pas le carré de la 
valeur probable de yf ; mais la valeur probable de y\y\ sera 
le produit des valeurs probables de yf et de y §. 


131. Supposons m 2 nul. Par l’intégrale 

j 9(yt)dyi 

nous devrions avoir la valeur probable de l’unité, c’est- 
à-dire i; or il est évident que 

/!+« 

j <f(y2)dy 2 = i, 

car cette intégrale représente la probabilité pour que y 2 soit 
compris entre —oo et c’est-à-dire la certitude. 


132. Si l’on effectue plusieurs observations y 2 ,yi, ■ •., y n , 
la valeur probable d’une certaine fonction ^ de ces obser¬ 
vations sera 

J <p Cri ) <p (rO • • • <p (r») +Cru y» •••»/*) 4ri dy n . 



ig2 


CHAPITRE XI. 


Si la fonction tjj est impaire, les éléments de l’intégrale 
seront deux à deux égaux et de signes contraires; l’intégrale 
sera nulle. 


133. Je reviens à l’hypothèse de Gauss 



La valeur probable de y tp +' 1 , avec cette hypothèse, est 
zéro; cherchons la valeur probable de y îp : c’est, par défini¬ 
tion. 



e~ h ^y^p dy. 


Observons d’abord que 

e ~ 1 

ou 

J e~ h y % dy — \/ti h 2 . 

Je différentie cette égalité p fois par rapport à h : 


Jo-hy'^yty f }y 



Le signe — est répété p fois dans chaque membre; il dis¬ 
paraît : 

fe-Wy** dy = vÆa~ p ~?1lL. 5 : ’~*> . 
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D’autre part, 

2 . 4 . 6 .. . 2 p = 2 p .p\, 

fo-hy’-ylp dy = s fi h P 2 _L ilEll.. 

La valeur probable y 2p est le produit de l’intégrale par 


\/ï 


— ; on a donc 

TT 


J h p pl 2 2p 


134. Ce résultat a été obtenu dans l’hypothèse 



une question se pose : la loi de Gauss est-elle la seule pour 
laquelle ce résultat se produit? C’est la seule. 

Cherchons la valeur probable de 
e— «(ro-r) 1 . 

Par définition c’est 


^ \J\ e ~ hr ' e ' /l(ro_r) ’ d y. 


On peut calculer directement cette intégrale; on peut 
aussi développer e~ n fra-y ) 5 en série convergente pour toutes 
les valeurs de y. 


D’où 


2 A p y p . 



e -hyi e -n{y,~y)i — ^^ p yip. 


De même, avec une autre fonction cp que celle de Gauss, 

f tp(7)e-»(r.-r) 5 c ? r= 2A 2p ÿ^. 
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Par hypothèse, les valeurs moyennes de y 2p seraient les 
mêmes dans les deux cas. Le rapport des deux intégrales 
serait donc i. 

Comme ce rapport reste le même quel que soit n, servons- 
nous d’un théorème précédemment démontré. 

La limite du rapport 

§My)<? n iy) d y 

fA(.r)<? a (y) d y' 

quand n croîtra indéfiniment, sera 

fi{y<>) 

My*Ÿ 

si, dans les limites de l’intégration, o(y) atteint son maxi¬ 
mum pour y =y 0 . 

Ici atteint son maximum pour y =y 0 ; la limite 

du rapport des deux intégrales est 



<p(7o) 


Comme ce rapport reste toujours égal à i 



y 0 étant tout à fait quelconque, c’est dire que la loi de 
Gauss est la seule qui donne à y- p la valeur probable que 
nous avons vue. 

135. Supposons que la loi des erreurs soit quelconque. 
On a fait n observations, ayant donné n erreurs indivi- 
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duelles y u y 2 , .. y a . Prenons la moyenne des observa¬ 
tions : nous commettrons une erreur, qui sera la moyenne 
des erreurs individuelles, 

Tl 

Gauss s’est proposé de calculer la valeur probable du 
carré de cette erreur; c’est par définition 

f - d yi d r°-— d y*- 

Je développe ce carré 

\ n J n 2 n? 

La valeur probable cherchée sera 

ly\ zlyifi 
n 2 n 2 

La valeur probable du produit jiy 2 est./i xy 2 ; comme 
les fonctions y t et y« sont impaires, et y« seront nulles. 
Il reste donc 

ÿ?-Krl+- ••+yl 
-^- 

L’intégrale se ramène à une somme de «intégrales; mais 
chacune d’elles porte sur la même fonction 

multipliée par y\dy u ou y\dy*, ..., ou y%dy n . C’est donc 
la même intégrale aux notations près. 

Donc la valeur probable du carré de l’erreur est 

n rî- 5Ï 

n- n 
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Ainsi la pâleur probable du carré de l’erreur commise est 
le carré de la pâleur probable d’une erreur individuelle 
divisé par n. 

Cette propriété suffit pour justifier l’emploi des moyennes ; 
elle a lieu quelle que soit la loi des erreurs. 

Toutefois, comme nous l’avons pu au Chapitre précédent, 
la loi de Gauss est la seule pouf laquelle la moyenne soit la 
pâleur la plus probable. 

Apec toute autre loi, la moyenne depiendra de plus en 
plus probable quand les obserpalions dépendront de plus 
en plus nombreuses, mais elle ne sera pas la valeur la plus 
probable. 


136. Cherchons la valeur probable de 

^.n+.ra+- • 2/1+1 . 


c’est une fonction impaire que nous élevons à une puissance 
impaire : la valeur probable doit être nulle. 

Cherchons la valeur probable de 

^ .ri+ .r*+■ - • -t- . 


Par une formule, généralisation de celle du binôme, 

(*+*-«- • •+r.) tJ =2 ï r î ^fej rtrt -• -fi» 


ou 


! a t ! cc 2 l.. .«[*1 

«1-1-«2-1--1- «[i= 2J9. 


Il faut prendre la valeur moyenne de chaque terme et la 
diviser par n-p. 

La valeur moyenne de certains termes sera zéro, si l’un 
des exposants « est impair. Tous les exposants doivent être 
pairs pour que cette valeur soit différente de zéro. 
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137. Traitons comme exemple 

Les a. ne peuvent être pairs que si : 1 ” = 4» et les antres 

nuis; ou 2 0 a x = a 2 = 2 , ce qui conduit à 

Xrî+fcgjrïjrï-i-R. 

R est l’ensemble des termes dont la valeur moyenne est 

nulle; le coefficient de 2y? v% est -r—; = 6. 

J 1J s 2 ! 2 ! 

Traitons encore 

Les-a ne peuvent être pairs que si : i°a 1 =6; ou 2 0 « x = 4, 
a 2 = 2 ; ou 3° = a« — ct z — 2 . 

R étant l’ensemble des termes dont la valeur moyenne est 
nulle, on a 

(ri + Ja • • • + y*) 6 = « -1-1 5 y! + 902 y \ y \ y f + R. 


Le coefficient de est ^ =i5; le coefficient de 

^y\y\y\ est ^nnr = 9°- 


Je m’en vais convenir de désigner la valeur moyenne 
de yl par M p . D’abord la valeur moyenne de 


(ji-i- 72 -f-..--i-r , l ) 4 

sera 

( yi ■+ y ,+• ■ ■ ■+ y») 4 = *m 4 +6 mi . 


En effet, dans tous les termes ont la même valëur 

moyenne, et il y en a n; dans 2y?y|, tous les termes ont la 

» , -i n(n— i) 

meme valeur moyenne et il y en a —- — 

2 
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La valeur moyenne de (y t + y 2 + • • - + J») 6 sera 

= nM 6 4- i 5 re(n — i)M 4 M 2 + 90 ^—-— Mjj. 

Dans 'ZyXyX, il y a autant de termes que à’arrangements 
de n lettres 2 à 2 ; le coefficient de M 4 M 2 est donc 

1 5n(n — 1 ). 

138. On pourrait poursuivre avec d’autres valeurs de 2 / 7 ; 
les expressions deviendraient de plus en plus compliquées. 

Tenons compte de ce que n est très grand; il y a dans le 
second membre des termes en n , en « ! ,.en n 3 ,etc. 

A titre d’approximation, ne considérons que les termes du 
degré le plus élevé en n. Pour 2/7 = 4 , ce terme est 3n a M|; 
pour 2/2 = 6 , ce terme est i5n 3 M|. 

Ainsi l’erreur moyenne 

yi+2l± LLL±ltL 
J n 

a comme valeur probable de sa quatrième puissance 

?=•(£)■, 

et de sa sixième puissance 



Calculons cette valeur probable en général, 

(y, -h.• • +7») ! '=2 LilT )! .v 2^^- • •&] * 

Dans le second 2 on ne permute que les indices des y. 
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Ne conservons que les termes où tous les a. sont pairs; les 
autres ont une valeur probable nulle. Il vient 


(ri -1-/2+- • •=2 


(zp)l 


a t I ce 2 1.. .«[j.1 


NM a .M, 


■a,««a, - ■ 


.M, 




Tous les termes sous le second 2, 

• -y$-, 

ont, en effet., la même valeur probable. Soit N leur nombre; 
évaluons N. 


139. Je suppose d’abord a, = a 2 . Si nous permutons y, 
et y 2 , nous retrouvons le même terme. Si nous tenions 
compte de l’ordre, nous aurions autant de termes que 
d’arrangements 2 à 3 de (i lettres choisies dans les n 
lettres y„ j 2 , ..., y, L \ nous pourrions avoir ainsi des 
termes répétés. 

Si les p exposants étaient différents, N serait égal au 
nombre des arrangements de n lettres p à p, c’est-à-dire 

égal à (ir=7)T' 

Je suppose pi exposants égaux à « 1 , p 2 à a 2 ,_, ps à oc K ; 

de plus, je suppose cc lt oc 2 , ..<x K différents, et 


Pi + P2 Pk— p- 

Je considère l’un des arrangements formés avec ces expo¬ 
sants ; j’y permute d’une manière quelconque les p t lettres 
dont l’exposant est oc lt les p 2 lettres dont l’exposant esta 2 ,..., 
les p K lettres dont l’exposant est a E . Je ne change pas le 
terme correspondant; par conséquent, ce même terme serait 
reproduit par 

p,l p 2 I... p K l 
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arrangements. 

„_ n\ 

~~ (» — F-)! P-iI P»1 ■ ■ ■ P-kI’ 

P|I p 2 I . . . p K I 

Ainsi N est un polynôme du degré p en n. 

La plus grande valeur que puisse prendre p est p. 

En effet 

OCj -p 0C 2 “P. . • “P 2 p . 

Les « étant tous pairs, la plus grande valeur de p corres¬ 
pondra à 

tXi — a 2 = .. .= 2 . 

Il n’y aura donc qu’un seul terme de' degré p, par rapport 
à n, dans N; avec notre ordre d’approximation, c’est le seul 
que nous devons conserver. Réduit à ce terme, N a la valeur 
suivante : 

w= n(n-r)...(«-p + i) 

P [ - 

En effet, tous les <x étant égaux, il en résulte que les lettres 
p ls p 2 , ..., p K se réduisent à 

Pi=P =P, 

p 2 =.. , = p K =0. 

Dans N, le terme en nP est 

n.p 

PÏ‘ 


140 . D’autre part, « t , « 2 , ..., étant égaux à 2 , 
M ai = Ma a — • • • = Ma = M 2 , 
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où M 2 est la valeur probable du carré d’une erreur indivi¬ 
duelle, y\. 

La valeur probable de (/i + y 2 -t- ■.. -‘ny a f p est donc 
(/i + 7 2 -t-... + y„)^ = 

La valeur probable de y~ p s’en déduit en divisant par n- p 

( 2 P)i /Mi Y. 

J p \ i p \ n ) 

Comparons avec le résultat donné par la loi de Gauss; on 
doit avoir 



La loi de Gauss est la seule qui conduise à cette expres¬ 
sion pour la valeur probable de l’erreur. 

Pourvu qu’il n’y ait pas d’erreurs systématiques, et qu’on 
fasse un grand nombre d’observations, en prenant leur 
moyenne, on commet donc, avec cette moyenne, une erreur 
dont la probabilité est.conforme à la loi de Gauss. 

L’erreur commise avec un instrument est la résultante 
d’un très grand nombre de petites erreurs indépendantes les 
unes des autres, et telles que chacune d’elles n’entre que 
pour une faible part dans le résultat ; l’erreur résultante 
suivra la loi de Gauss. 

141. Posons le problème d’une autre manière. 

On a commis dans les observations un certain nombre 
d’erreurs individuelles, y l} y 2 , ...» y n , indépendantes les 
unes des autres ; l’erreur totale est 
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Supposons d’abord que toutes ces èrreurs suiventla même 
loi, et qu’il n’y ait pas d’erreurs systématiques. Le problème 
est le même. 

La valeur probable de y 2p+i sera nulle. 

Nous avons évalué au paragraphe 136 la valeur pro¬ 
bable de 

Ici nous avons à chercher la valeur probable de 
(Ji-f- Xi-h--•+ ?*)**■ 

La probabilité pour que yt soit comprise entre deux 
limites données a et (3, 

/ ® ( Jï) dy t . 


est la même par hypothèse pour y u y\, y n . 

Il nous suffit de multiplier le résultat obtenu pour la valeur 
probable de 

c’est-à-dire 


(*P) I 
P' 


(M,y 

\ 2n J 5 


par n*p, pour obtenir la valeur probable de y 2j} , 


—_(2^)I 
y - P \ 



et, en posant «M 2 =?M, 




Ainsi la forme de cette expression reste la même, et. 
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en raisonnant comme précédemment, on conclurait que 
la probabilité pour que l’erreur totale y soit comprise 
entre deux limites données reste conforme à la loi de 
Gauss. 


142. Ce raisonnement n’est pas encore satisfaisant, parce 
qu’il est peu vraisemblable que toutes les erreurs indivi¬ 
duelles suivent la même loi. Supposons que la loi ne soit pas 
la même, mais que toutes les erreurs individuelles soient 
sensiblement du même ordre de grandeur et que chacune 
d’elles contribue pour une faible part à l’erreur totale ; 
soient 

•'a 


la probabilité pour que yi soit compris entre a et (3 ; 



2 


la probabilité pour que y 2 soit compris entre a et (3 ; 


r P 

/ <P«(j n ) dy„. 

J a. 

la probabilité pour que y n soit compris entre et et (3. 

Je suppose toujours <p t , (p 2J • • •> fonctions paires, autre¬ 
ment dit qu’il n’y a pas d’erreurs systématiques. 

Je prends la somme M des valeurs moyennes des carrés 
des erreurs, _ _ 

ÿl+yl -1 — +y%= m . 

Si toutes les erreurs particulières suivaient la même loi, 
on aurait la même valeur M 2 pour y\, y\, ..., yf t , et la 
somme M serait nM 2 . 
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Je me bornerai au calcul correspondant aux premiers 
exposants. 

En supposant que toutes les erreurs suivent la même loi, 
nous avons trouvé que la valeur moyenne dey 2 est M; celle 
dey 4 , 3M 2 ; celle de y 6 , i5M 3 .... 

Refaisons le même calcul en supposant la loi différente 
pour les différentes erreurs individuelles. J’observe que 
le produit y“y“ a pour valeur moyenne la valeur probable 
de y™, multipliée par la valeur probable de y\. En effet, la 
valeur probable du produit y“y£ sera représentée par • 

ff <?i ( Ji ) ®2 (y. ) y? J? dy t dy s ; 

le produit des valeurs probables de yf et de y£ sera repré¬ 
senté par 

f <Pi (yi ) jf dy x J <p 2 (y 2 ) y” dy 2 . 

Le théorème reste donc vrai dans ce cas-ci comme dans 
le précédent; et si/w est impair, la valeur probable sera 
nulle. 

La différence à remarquer, c’est que les valeurs pro¬ 
bables d e y™, yf, ...,y« ne sont plus égales entre elles. 

Remarquons aussi que les quantités ..., <p„ sont 

censées du même ordre de grandeur. 

143. Cherchons la valeur moyenne de y 2 . On a 
y 2= 2 y* -I- 2hy i y i . 

Donc, 

y 2 =23ï+ 22 Jiy2; 

le dernier terme disparaît; il reste 
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Pour la valeur moyenne de y 4 , on trouve 

ÿ ? =- s ÿî’-t- 6 2ÿ!ÿf» 

en laissant de côté les termes où figurent des exposants 
impairs. 

Le second terme sera beaucoup plus grand que le premier : 
le premier 2 est un ensemble de n termes, le second 2 un 

,, . n(n — i) . 

ensemble de-termes; ces nombres de termes sont 

2 

respectivement de l’ordre de n et de l’ordre de n 2 ; le pre¬ 
mier est négligeable devantle second. Les différents termes 
des deux 2 sont d’ailleurs, par hypothèse, très petits et 
sensiblement du même ordre de grandeur. On a, d’autre 
part, 

ou 

3M 2 =32(Jf>+623î3ï. 

Le premierterme est encore négligeable devantle second, 
et celui-ci est identique dans les deux expressions. 

Donc, avec l’approximation adoptée, 

pr^M 2 . 

Pour la valeur moyenne de y 6 , on a 

ÿ® = 2y? -!-i52y*y 2 -!-9o2y 2 y 2 y 2 . 

Calculons d’autre part i5M 3 , 

i5M 3 = i52(ÿf) 3 -i-452(y?) 2 y:; -l-9o2yfy|y 2 . 

Comparons les deux seconds membres. Le premier 2 
porte sur n termes, le secondé sur n(n — r), le troisième2 

sur n ^ n ~ r ^” 2 ) ; ces nombres de termes sont de l’ordre 

1.2.3 

de grandeur de n, de n 2 , de n 3 , et les deux premiers 2 sont 
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négligeables vis-à-vis du troisième. Comme le terme qui 
n’est pas négligeable est le même, on a 

T^iàM 3 . 

144. En résumé, supposons que l’erreur finale soit la 
résultante d’un très grand nombre d’erreurs partielles, 
indépendantes les unes des autres, et qu’il n’y ait pas 
d’erreurs systématiques; supposons aussi que ces erreurs, 
qui seront sensiblement du même ordre de grandeur, 
entrent chacune pour une faible part dans l’erreur totale. 

Dans ce cas, l’erreur résultante suivra sensiblement la loi 
de Gauss. 

Telle est, il me semble, la meilleure raison à donner de 
la loi de Gauss. 

Fonctions caractéristiques. — J’appelle fonction caracté¬ 
ristique f (a) la valeur probable de e ax ; on aura donc 

/(*) 

si la quantité as varie d’une manière discontinue et peut 
prendre seulement un nombre fini de valeurs, et 

f(a)~j' ©(; x)e aæ dæ, 

si as varie d’une manière continue et si 9 (as) représente la 
loi de probabilité. Il est clair que 

f(0 «)=!+£(.) + £ (-*) + 7 ^ (^) +■ * - 
(osp) désignant la valeur probable de osp. On voit que 
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La fonction caractéristique suffit pour définir la loi de 
probabilité. On a en effet par la formule de Fourier 

f(itx)=zf cp(x) e tax dx, 

J—as 

2719 ( 2 ;)=/ f (ia.) e~ iax da.. 

J—as 


Si deux quantités x et y sont indépendantes et si /(«), 
fi (a.) sont les fonctions caractéristiques correspondantes, 
la fonction relative à as -+-y sera le produit/ (a) / t (a). En 
effet, comme nous l’avons vu au paragraphe 130, la valeur 
probable du produit e a ^ + ^ sera le produit des valeurs pro¬ 
bables de et e a 
Avec la loi de Gauss 



on trouve aisément 

“L 

/(«) = *«*. 

Supposons que deux quantités as et y, indépendantes, 
suivent l’une et l’autre la loi de Gauss, la première avec la 
précision h , l’autre avec la précision h'; les fonctions carac¬ 
téristiques correspondantes seront 

g» a* 
e ih , e wh '. 

La fonction caractéristique relative à x -t -y sera le pro¬ 
duit 

a " iii 

e4A “, où V = h + w 

La somme x -+- y suivra donc aussi la loi de Gauss avec la 
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précision îi"; c’est le théorème de M. d’Ocagne, démontré 
au paragraphe 60. 

Supposons maintenant une erreur résultante qui soit la 
somme d’un très grand nombre d’erreurs partielles, très 
petites et indépendantes. Soient f\{cx.),f^a), les 

fonctions caractéristiques correspondantes. 

Chacune d’elles sera de la forme 

/ R (cc) — 

L’erreur correspondante étant toujours très petite, les 
coefficients (3 décroîtront très rapidement. 

La fonction caractéristique relative à l’erreur résultante 
sera le produit 

/i(«)/ï(«)-••/»(«)» 

c’est-à-dire 

Les erreurs n’ayant pas de caractère systématique, nous 
aurons 

2(3,=o. 

D’autre part, les coefficients (3 décroissant très rapidement, 
2(3 3 , 2(3 4 , etc. seront négligeables devant 2(3«, et il res¬ 
tera 

e“ îS ?=, 

ce qui est la forme de la fonction caractéristique qui con¬ 
vient à la loi de Gauss. 

143. On a donné de la loi de Gauss une vérification 
a posteriori, fondée en somme sur le théorème de Bernoulli. 

Si une certaine épreuve peut donner naissance à plu¬ 
sieurs événements tels qu’un seul d’entre eux se produise 
à la fois, et si l’on répète l’épreuve un très grand nombre de 
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fois, les nombres des événements qui se produiront seront 
très sensiblement proportionnels à leurs probabilités. 

On mesure un grand nombre de fois une quantité z; les 
résultats sont æ t , æ 2 , ..., æ n , et les erreurs y u y 3 , .. ÿ n . 

Si nous, connaissions bien z, nous connaîtrions bien 
yu yz> •••> y*; si nous comptons le nombre d’erreurs com¬ 
prises entre deux limites données, a et b, ce nombre sera 
proportionnel à 

<p(ri)4ri- 


On peut construire la courbe qui représente œ ( y t ). 



On divise l’axe des abscisses en un certain nombre de 
parties égales à ce : chacun de ces petits intervalles est assez 
grand pour que le nombre des erreurs dans cet intervalle 
soit grand ; au milieu de cet intervalle, élevons une ordonnée 
proportionnelle à ce nombre d’erreurs. 

La courbe obtenue, si la loi de Gauss est vraie, aura pour 
équation 



C’est une courbe asymptotique à l’axe des abscisses et 
symétrique par rapport à l’axe des ordonnées. 

Ce résultat se vérifie, paraît-il. Ainsi Bessel a pu repré- 
P. i5 
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«enter les résultats d’un grand nombre d'observations de 
Bradley, sur la déclinaison d’une étoile. 

446. On peut aussi se dispenser de tracer une courbe, et 
vérifier par le calcul. 

Remarquons, en premier lieu, que, si l’on ne connaît pas 
la véritable grandeur à mesurer, on adoptera la valeur 
moyenne des observations comme la représentant. 

Vérifions par le calcul : la valeur moyenne de y-p serait, 
d’après la loi de Gauss, 

1 JL. 

J p ! 2 2 r hP ’ 

celle de y 2 ?, 

— ( 2£)1 _I_. 

J q \ ht 

Éliminons h. 



On vérifiera que cette relation est satisfaite. 

Pour les observations faites, nous connaissons les erreurs 
yu y 2 , • • -, J». L’expression 

Vy\ p +- yjP+.-.-i- y% p 

Vy\ 9 +yl q +-+ 

doit être égale à 



cette vérification se fait également, paraît-il. 
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On peut encore considérer y 2 ?-*- 1 . La valeur probable 
serait mille si l’on prenait y avec son signe. En ne considé¬ 
rant que la valeur absolue, on aurait comme valeur pro¬ 
bable, d’après la loi de Gauss, 

2 


f i/5y 2 P+ 1 e~ h >* dy; 

o V 


cette intégrale eulérienne n’est pas nulle. 

Si l’on avait pris y avec sa valeur relative, on eût eu 


/ \/^y 2p+i e ~ hy ' d ^ 


qui est nulle. 


147. Exception à la loi de Gauss. — J’ai plaidé de mon 
mieux jusqu’ici en faveur de la loi de Gauss dont nous 
allons maintenant tirer les conséquences.. Peut-être pour¬ 
tant la cause n’était-elle pas parfaitement bonne. 

Il ne faudrait pas avoir une sorte de superstition pour la 
méthode des moindres carrés, à laquelle va nous conduire 
la loi de Gauss. Nous avons vu que l’on avait - parfois des 
raisons de ne pas adopter cette loi. 

Elle suppose, en effet, qu’il n’y a pas d’erreur systéma¬ 
tique, et il y en a toujours. 

D’un autre côté, nous avons vu qu’on est souvent conduit 
à ne pas appliquer le procédé de la moyenne, et, par exemple, 
à rejeter une observation qui présente avec toutes les autres 
une divergence exagérée. 11 n’en serait pas ainsi, si la loi de 
Gauss était toujours vraie. 

C’est donc que, dans certains cas, on croit avoir des rai¬ 
sons a priori de ne pas adopter la loi de Gauss. Qu’est-ce à 
dire? Pourquoi rejetons-nous une observation divergente ; 
c’est parce que nous supposons qu’elle est entachée d’une 
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erreur grossière, due â un accident quelconque. C’esl donc 
que nous ne considérons pas a priori une erreur grossièr 
comme tout à fait improbable, comme elle le serait d’après 
la loi de Gauss. 

148. Entrons dans quelques détails. On peut dans certains 
cas supposer que l’erreur totale se compose de deux erreurs 
partielles; la première, due elle-même à l’accumulation d’un 
grand nombre d’erreurs très petites, suivra la loi de Gauss; 
la deuxième sera une erreur grossière, dont la probabilité 
est, il est vrai, très faible, mais qui peut être très notable. 

C’est ce qui arriverait par exemple si l’on avait négligé, 
par inadvertance et sans s’en apercevoir, quelque précau¬ 
tion essentielle, quelque réglage indispensable. Et c’est là 
une hypothèse qui n’a rien de déraisonnable. Soient alors 


y—y 1+72 


l’erreur totale, yi et y 2 les deux erreurs partielles. Alors ji 
suivra la loi de Gauss, et la fonction <p(y t ) qui définit la loi 
de probabilité sera 



et la fonction caractéristique correspondante sera e iA . 

En ce qui concerne l’erreur y 2 , elle pourra être égale 
à o, k et — k, les probabilités respectives de ces trois 
erreurs étant i — 2 s, s et s; la fonction caractéristique cor¬ 
respondante sera 

1 — 2e-4-e(e ît *-i- e~ ak ) 

et la fonction caractéristique relative à l’erreur totale sera 
le produit 

— 

e ih [ 1 — 2 £ + s( 6 tt + e - “*)]. 
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Quant à la fonction (p(y), elle sera 


^[(i— as) e -A(r+*)*)]. 


Supposons maintenant que nous voulions savoir quelle 
est la valeur probable de la quantité mesurée z, étant donné 
que n observations ont donné pour résultats x u x z , x n . 
Nous savons que tout dépend du produit 

<P(^i— -=)<p(-^ 2 —-s) ••• y(x„ — z); 

la fonction 9 ayant trois termes, ce produit en aura 3" ; on 
trouvera alors pour la valeur probable cherchée 

2s^-e- g t 

le numérateur et le dénominateur ayant 3 n termes; on aura 
d’ailleurs 


z k z 


0j-+- 0 2 


n n 


les nombres 9 pouvant prendre les valeurs o, 1 ou — 1 ; 
comme les nombres 9 sont au nombre de n et peuvent 
prendre chacun trois valeurs, cela fait bien 3 n combi¬ 
naisons. 

On aura ensuite 


et 


— 2S) n 


(r^r 


a k — h 2 £ ( X[— z k — 9 t k)\ 


Pour simplifier, nous supposerons trois observations seu¬ 
lement ayant donné pour résultats 0 , 0 et k, et nous négli- 
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gérons le carré de 2; la valeur probable deviendra alors 


j[] — s( 2e~ a P-l-eP)]-}- ^-e( 2 -t-e- 3 P), 

où (3 si (3 est grand, c’est-à-dire si la différence 

entre l’observation discordante æ 3 =k et les observations 
concordantes æ 2 = o est grande par rapport à la préci¬ 
sion de l’instrument, il peut se faire que seP soit fini, et alors, 
en ne conservant que les quantités finies, la valeur probable 
devient 

j(i — £eP), 

ou, plus exactement, puisque nous ne pouvons plus négli¬ 
ger le carré de teP, 

i k 
3 1 4- s eP 

Elle est donc plus petite que la moyenne arithmétique, 
c’est-à-dire que l’on doit attribuer aux observations concor¬ 
dantes un poids plus grand qu’à l’observation discordante. 
On admet, en somme, qu’il est plus naturel de supposer que 
cette observation discordante est due à une erreur grossière 
de la seconde sorte qu’à une erreur de la première sorte 
conforme à la loi de Gauss, car il est très peu vraisemblable 
que cette dernière pnisse atteindre d’aussi grandes valeurs. 

149. On peut s’amusera faire le calcul avec d’autres lois; 
nous avons d’abord celles où les grandes erreurs sont plus 
vraisemblables que dans la loi de Gauss ; on peut prendré 
par exemple 

Tfr) = „(,+>) ’ = 

Le calcul ne présente aucune difficulté; avec celte der- 
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nière loi, et en supposant trois observations xi~x t et 
«3 >«25 on trouve pour la valeur probable de s 


«i-t-3X- 


X 3 
2 


I 


— e 
2 



Pour x z très grand, cela se réduit à 

2 -> 

«I •+- 3X, 


ce qui montre que, x t et x t restant fixes, la valeur probable 
de z ne croît pas indéfiniment avec x z . Ici encore le poids 
de la valeur discordante est plus petit que celni des valeurs 
concordantes. 

Considérons maintenant des lois où les grandes erreurs 
sont moins vraisemblables qu’avec la loi de Ganss; comme 
par exemple 

cp^rrrKe-^" 4 ; 

on trouvera alors que le poids de la valeur discordante est 
pins grand que celui des valeurs concordantes. Et cela 
paraît d’abord assez paradoxal. Mais il est aisé de s’expli¬ 
quer ce résultat. Supposons que les trois observations aient 
donné 

o, o, k, 

la moyenne arithmétique étant les trois erreurs ont été 

k k 2 k 
T 3’ T‘ 

Si l’on avait pris —, les trois erreurs auraient été —• La 

2 2 
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probabilité d’une erreur décroissant très vite quand cette 

2 Je 

erreur croît, il peut se faire qu’une erreur -y soit tellement 

invraisemblable qu’elle puisse être regardée comme prati- 

k 

quementimpossible, tandis qu’une erreur — resterait admis¬ 
sible. Effectivement 


(îHîH*)>(îMî)M£ 


150. Quel genre de modification y aurait-il donc, dans 
ces derniers cas, à faire subir à la loi de Gauss? La courbe 



que nous avons précédemment tracée, devrait être relevée 
dans les parties éloignées de l’axe des ordonnées. 

Antre exemple; si la loi de Gauss était exacte, on pour¬ 
rait, en multipliant suffisamment les observations, obtenir 
une précision aussi grande que l’on voudrait. Dans bien des 
cas, on a le sentiment que c’est là une illusion. Avec un 
mètre divisé en millimètres, on ne pourra jamais, si sou¬ 
vent qu’on répète les mesures, déterminer une longueur à 
un millionième de millimètre près. 

Comment conviendrait-il de modifier la courbe de Gauss 
pour tenir compte de ce fait? Ici, ce qui rend illusoires nos 
efforts pour atteindre une précision infinie, c’est que nous 
n’avons pas plus de chances de ne pas nous tromper du 
tout, que de ne nous tromper que d’un micron ou de deux 
microns. La courbe devrait donc comprendre un petit palier, 
un petit segment de droite horizontale y = const. s’étendant 
de part et d’autre de l’axe des y. 

Mais une pareille hypothèse est encore insuffisante pour 
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rendre compte des faits. Avec le raisonnement du para¬ 
graphe 135, on verrait que quelle que soit la loi des erreurs, 
si elle est de la forme (p (a; £ -— z), la valeur probable du carré 
de l’erreur commise sur une moyenne de n observations tend 
vers zéro quand n croît indéfiniment. On peut le voir éga¬ 
lement à l’aide des fonctions caractéristiques. Soit F (a) la 
fonction caractéristique relative à une observation isolée; 
la fonction caractéristique relative à la moyenne de n obser¬ 
vations sera 

m- 

Supposons que F(«) soit analytique et que 
F(«) = i-t-Ai«-t-A 2 « J -t-_ 


Nous supposerons que l’erreur n’a pas de caractère systé¬ 
matique, c’est-à-dire que Ai = o; nous aurons alors 

logF(a) =B 2 « J -+- B 3 « 3 -h. . 

d’oh 



et à la limite 

|0 S [ f (ï)]’ =<> ’ 

ce qui montre que l’erreur est nulle. 

A la vérité, on pourrait supposer que F(«) n’est pas ana¬ 
lytique et prendre par exemple 

F(«)r=e-I“l. 

On en dédûirait 
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de sorte que l’erreur sur la moyenne ne tendrait pas vers 
zéro; cette hypothèse correspond à la suivante : 


®(r) = 


■K I- 


■y- 


Comment le raisonnement du paragraphe 135 se trouve-t-il 
en défaut dans ce cas? 

D’après ce raisonnement, la valeur probable du carré de 
l’erreur snr la moyenne est n fois pins petite que la valeur 
probable du carré de l’erreur d’une observation isolée. 
Gela reste vrai, mais ici cette dernière valeur probable, 
représentée par l’intégrale 


i y'-dy 


est infinie. 

Cela n’est pas encore lâ solution que nous cherchons. 
Nous ne verrions pas l’erreur sur la moyenne tendre vers 
zéro, si la fonction <p(y) ne tendait vers zéro plus vite 

que pour y très grand, c’est-à-dire si de très grandes 


erreurs n’étaient pas très improbables. 

Mais si nous ne pouvons compter qu’un instrument quel¬ 
conque nous donnera une approximation indéfinie, à la 
condition de répéter suffisamment les observations, ce n’est 
pas à cause des très grandes erreurs, c’est au contraire à 
cause des très petites erreurs, le bon sens l’indique suffi¬ 
samment. 


151. Il faut donc admettre que la fonction (p n’est pas de 
la forme cp(ar £ — z), mais de la forme cp(a;/, z). Supposons 
par exemple que l’instrument soit gradné en divisions dont 
nous puissions apprécier le dixième; en général, nous ne 
noterons sur notre carnet que des nombres entiers de 
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dixièmes : si nous y inscrivions des centièmes ou des mil¬ 
lièmes, ce serait tout à fait au hasard. Supposons qu’il n’y 
ait d’autre erreur à craindre que l’erreur de lecture ; pre¬ 
nons pour unité le dixième de division, de façon que x t soit 
toujours un entier. Nous pouvons admettre par exemple qne, 
si z est compris entre p — s et^? -t-e (p étant entier), nous 
noterons certainement Xi=p; que si z est compris entre 

p + s et p -t-i — s, il y aura une probabilité ^ pour qne nous 

marquions x t =p et une probabilité - ponr que nous mar¬ 
quions X(= p -+-1 . 

Si z est compris entre p -+- s et p -t -1 — s, et que nous fas¬ 
sions n observations, nous marquerons ni fois p et ni' fois 

p -1 -1 ; le rapport de n' et de n" à ^ tendra vers i quand le 

nombre des observations croîtra; la moyenne 

n'p n"(p -t-i) 
n 

tendra vers p -+- - et ne tendra nullement vers z. 

2 

On arriverait à des résultats analogues avec des lois ana¬ 
logues, mais plus compliquées, soit que la probabilité pour 
qu’on lise p varie d’une façon continue avec z, pourvu que 
cette probabilité ne soit pas une fonction linéaire de z— p ; 
soit, ce qui est plus vraisemblable, qne la courbe qui repré¬ 
sente cette probabilité présente un palier comme cela avait 
lieu dans l’exemple particulier que nous venons de traiter ; 
soit enfin qu’à une erreur de lecture offrant l’une de ces 
particularités, viennent se superposer des erreurs prove¬ 
nant d’autres sources et suivant la loi de Gauss. 

Si cp (x h s) ne dépend pas uniquement de la différence 
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y £ = xi — z, la valeur probable de l’erreur qui est 



s)dy t 


dépend de z. Il se peut qu’elle ne soit pas nulle, bien que 
l’erreur n’ait aucun caractère systématique proprement dit. 
Si en effet cette valeur probable est représentée par0(.s), il 
suffit que l’intégrale 

I 8{z)dz 

✓vî-» 

[ou mieux I ty(z)8(z)dz, où i}>(s) représente la proba¬ 
bilité a priori pour que z ait une valeur donnée], comme 
dans le chapitre X, soit nulle, pour que l’erreur ne puisse 
pas être dite systématique; mais 8(z) n’a pas besoin d’être 
identiquement nul. Par exemple, reprenons l’hypothèse où 
nous nous étions placés plus haut, et supposons de plus que 
nous sachions d’avance que z est compris entre p et p -t-i ; 
de sorte que ty(z) est nul quand z n’est pas compris entre 
ces limites et peut être regardée comme une constante dans 
le cas contraire. On aura alors 

0(-) —P — s (p<z<p- He),. 

—6 {p -+- eO <p -+-1 — e), 

8(z) =p -t-i — s [p-t-i — S<.q</>-t-l). 

Il est aisé devoir que 

<\>(z)8(z)dz 

152. Reprenons alors la formule du Chapitre XI qui nous 
donnait la valeur probable du carré de l’erreur commise sur 
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la moyenne 

2rl , 

ri z n? 


ce qui peut encore s’écrire 


ri 

n 


n{n —i) 


(re¬ 


cette formule subsiste seulement quand les valeurs pro¬ 
bables y et y 2 de l’erreur d’une observation isolée et de 
son carré vont dépendre de z. D’après ce qui précède, 


y — s(z) 


peut ne pas être nul ; le premier terme tendra vers zéro 
quand n croît indéfiniment; mais il n’en est pas de même 
du second qui tendra vers 

**(*), 

de sorte que la valeur probable du carré de l’erreur com¬ 
mise sur la moyenne devra s’écrire (en n’attribuant plus à - 
une valeur particulière) 

C e*(*)«!»(*)& 

J - M 

et ne s’annulera pas pnisque tous ses éléments sont posi¬ 
tifs. 

On pourrait aussi se servir de la fonction caractéristique; 
celle-ci peut s’écrire 


F(«, s) = eh a " i -P* a, - i --; 

les (3 dépendent de z et (3,, qui n’est autre chose que 8{z), 
peut ne pas être nul. Pour l’erreur commise sur la moyenne, 
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la fonction caractéristique sera 



qui ponr n très grand se réduit à 





2 

- -t-- 


Les valeurs probables de l’erreur sur la moyenne et de 
son carré seront alors (3 t et $\ pour une valeur particulière 
de z, et si on ne se donne pas une valeur particulière de z, 

j'p i ty(z)dz=:0, J'pi ty(z)dz> 0 . 


153. La loi de Gauss suppose encore (p fonction de y seu¬ 
lement, y étant égal à x — z, tandis que cp peut dépendre 
de x et de z. 

Par exemple, pour tenir compte de l’erreur décimale 
nous aurions pu prendre 

6(x) étant une fonction périodique de x, de période i, 
qui serait maximum pour les décimales qu’affectionnent 
certains observateurs et sur lesquelles ils retombent tou¬ 
jours. D’autre part, il y a moins de chance d’erreur si l’on 
tombe précisément sur une division donnée directement 
par l’instrument, que si l’on est obligé de subdiviser une de 
ces divisions au jugé. Alors h ne serait plus une constante, 
mais une fonction de x qui aurait une période égale à r ; la 
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précision serait plus grande quand x serait un nombre 
entier que dans le cas contraire; si même l’observateur 
évalue fort bien le dixième, mais ne sait pas donner 
d’autres décimales, 8(x) sera rigoureusement nul pour 
toute valeur de x qui ne sera pas multiple de un dixième. 
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ERREURS SUR LA SITUATION D’UN POINT. 


154. Problème des erreurs commises sur lu situation 
d’un point. — Au lieu d’une seule grandeur mesurée, il 
arrive souvent qu’on en combine plusieurs, comme les deux 
coordonnées d’un aslre, etc. 

Je suppose, par exemple, que, pour évaluer la situation 
d’un point dans un plan, on ait fait n observations, et que 
l’on ait trouvé pour ses deux coordonnées rectangulaires, 
x et y, les valeurs 


æ l>yu ‘^ 2 , y 2 , Xn, y n• 


Les erreurs commises sont 


Xi—x et yi—y,- 
x 2 —x et y t — y. 


x n —x et y n —y. 


Je vais poser 


Xl — x + l u yi = y + -ni, 


æ n =x-h% n , 


ÿn — y -l - ‘On* 
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Les erreurs commises sont ainsi représentées par 

?I 6t Y)i, 

? 2 et t5 2 , 

• • • •> 

et n n . 

155. On peut se demander quelle est la probabilité pour 
que les erreurs commises sur la première observation soient 
comprises entre et ^-t- d£ u m et th-+- dn^ 

Soit 

<p(?i. fi i) rf ?i d-n 1 

cette probabilité ; il pourrait se faire que cp dépende de x et 
de y, mais je suppose qu’il n’en est rien, et que <p dépend 
seulement des erreurs. 

Ces erreurs peuvent être indépendantes ; alors cp serait le 
produit de deux autres fonctions net la probabilité serait 
représentée par 

mais je suppose encore que l’erreur commise sur l’abscisse 
ne soit pas indépendante de l’erreur commise sur l’or¬ 
donnée. 

Le raisonnement est analogue à celui de Gauss dans le 
cas d’une variable. On s’appuie sur le postulat suivant : 

Si on a fait un certain nombre d’observations, on reporte 
les points observés sur un plan; la position la plus probable 
est le centre de gravité de ces points supposés de masse 
égale. 

156. A l’exemple de Gauss, nous admettrons que cette 
manière de voir est légitime. Quelle est la loi d’erreurs qui 
justifie cette hypothèse? 


P. 


l6 
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îa6 

Cherchons la probabilité pour que les coordonnées du 
point soient comprises entre x et x -+- dx, y et y -+- dy. 

C'est un problème de probabilité des causes, el il nous 
faut chercher encore 

Pi^i 

'ZpiXSt 

bt i est la probabilité a priori pour que les coordonnées 
soient comprises entre x et x -+- dx, y et y -h dy; représen- 
tons-Ia par 

BTi= ty(x, y) dxdy. 

Pi est la probabilité pour que, si la cause agit, le phéno¬ 
mène observé se soit produit : ici, le phénomène ohservé, 
c’est que les Coordonnées sont l’une entre 

Xi et Xi + dXi, 

Xi et x s dxi, 

• • 

x n et x n + dx n , 

l’autre entre 

y\ ot + 

Yi et yi-hdyi, 

• • . . • 9 

J'n et y dy n . 

p c est le produit des probabilités relatives à chacune des 
observations 

Pi=< p (11, Vi) %) • • • <p(£,» fin) d^dnidlidfii ... dl n d-n n . 

Soit 

n = ?(£r> Tli) <p(£« fl 2) • • • <?(£nr fin)- 


PltSj 

IpiVSi 


Alors 
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sera 

Il di dx dy </ç, dn\ d £ 2 dri,... d\ n dn„ 
/n<|> dx dy d$^ d't\i d% 2 dn, ... d\ n dn a 

l’intégrale étant prise par rapport à x ely; il reste 

Iluj idxdy 
/"♦ dx dy 


Le dénominateur est constant et indépendant de x et de 
y; la probabilité est donc proportionnelle au numérateur. 


157. Quelle sera la valeur la plus favorable? celle qui rend 
maximum le numérateur Ity. Or 

H = <p (^i — x, y , — y) <p (x, — x, v 2 — y) ... cp (x a — x, y n —y). 


Quelles sont les valeurs de x et de y qui rendent ce pro¬ 
duit maximum? D’après le postulai, c’est la moyenne arith¬ 
métique de a? t , x. 2 , ..., pour x, et la moyenne arithmé¬ 
tique de y lf j 2 , •.., y n pour y. Égalons les dérivées loga¬ 
rithmiques aux fonctions suivantes : 


afcp 


dx\ 

dx _ 

T" - 


dm 
dtj 1 
<a 


F 0 (^i, Hi), 


d<b 



La dérivée logarithmique de üi|/ par rapport à x, qui doit 
s'annuler pour le maximum est 

— F(&, y)i) — F(£,, y]j) —... — F(£,„ ïi, t ) + 6 = o, 

d’où 

F(£i, vh)-t-F(Ç 2 , '/iO+.-. + FÈ,, r„ l ) = 8. 
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La dérivée logarithmique par rapport à y conduirait à 

Fo(£i> ■'11) "+■ F 0 (^2 i Yl«) + • • •-t-^'o(?re) fl n ) = 9 0* 

Ces deux relations devront être vérifiées toutes les fois 
qu’on aura 

aq-l- x 2 -h _-+- x a = nx, 

yi+yt+---+y a — n y> 

c’est-à-dire 

£t + Ç,-t---+- ln=0, 

Vi -+- n 2 -+- • • • -+- rin= O. 

' 158. Il s’agit de déterminer les fonctions <p et i|/ de telle 
façon qne les deux systèmes d’équations soient compatibles. 

Différentions ces deux svstèmes, en regardant x et y 
comme constants, et en faisant varier^, un, £ 2 , ni*» •••»£»»*]»• 
La dérivée de 0 et de 0 O , dans le second membre, sera 
nulle, puisque 0 et 0 O ne dépendent pas de ces quantités. 
J’appelle F* et F“ les fonctions suivantes : 

F* = F (S* y u), 

F? = F„(&, ru). 

Le premier système devient 

cfFj-H ^F 2 -i-• . .-H C?F n 0 5 
dE\-± d¥\ +... + dVl = o, 

et le second système est 

d£i -+- cfà# -H d% n = 0 , 
drii ^Y] 2 -t-... -f- df] a = o. 

Tels sont les deux systèmes qui doivent être équivalents. 
Les deux premières équations doivent être une combi¬ 
naison des deux dernières; nous devons avoir identi- 
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é^Fj + <iF 2 -1-... -h dF n 

— A d^ 1 -f - B (fai j -t- A d^ 2 - 4 - B dyj^ -h •.. -H A d^ n -4- B d-f\ n % 


Identifions les deux membres : 

A _ <2Fi _ rfFj _ _ dF n 

g dF 1 dFi _ dF n 

dtii dtit ’ " dn n 

A ne devrait dépendre que de£i et de 751 , puisqu’il est égal 
dF 

à il devrait aussi ne dépendre que de £ 2 et de 75 ,, puisqu’il 

“Çl 

est égal à ^ 2 ; .... 

“ç 2 

Donc A et B sont des constantes : F t est une fonction 
linéaire de £, et de tîx- 

De même FJ est une fonction linéaire de £1 et de 7 h. 
J’ajoute que, en représentant F 2 par 

F t — A^i -t- Bt]i -+- G, 

la constante d’intégration C est nulle. 

En effet, si je remplace F t , F 2 , ..., F„ par leurs valeurs, 
j’arrive à 

A(Si + |i + - • •+ £n) +B(7],H-7] 4 + . . . -t- 7Î«) + «C = 0. 


Cette équation doit être satisfaite toutes les fois que 

5i+ 5*+...-+- £» = o, 

1)1 + 7) 2 +. . .+ Wn— O. 


Donc 


«C = 0, 
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el, comme 8 esl indépendant de n, 

8 = o, C = o. 


-Il en résulte que i{> est une constante. 

Pour que la théorie de Gauss soit applicable, il faut que 
l’on n’ait aucune idée a priori sur la valeur de la quantité 
cherchée. 

On aurait de même 

FÎ=DS 1 + Eti 1 . 


D’ailleurs B = D, car 


et l’on a 




dF t 
du i’ 


B = 


rfF° 
dïi '' 


dF t _ d f ; 

dfi 1 — d'E, t ’ 


en vertu de la définition de F et de F 0 . 
On arrive enfin à 


log(p = A£f + aBÇint + Eïjî -+- G, 


G étant une constante que nous écrirons logH. 

Le polynôme doit être négatif, car 

une erreur infiniment grande doit avoir une probabilité 
nulle : représentons-le par — P. 


d’où 

L’intégrale 


log<p=—P -t-logH; 
<o = H e~ p . 



<p de, ! dti 


1 


doit être égale à l’unité pour toutes les valeurs possibles de 
x et de y. 



ERREURS SUR LA. SITUATION d’üN POINT. 231 

159. Ce raisonnement donnerait prise anx mêmes objec¬ 
tions que le raisonnement de Gauss. 

Si nous admettons la loi de Gauss en dépit de ces objec¬ 
tions, on peut construire les courbes 

P = const., 

en plaçant l’origine au point visé, c’est-à-dire à très peu près 
le point moyen. Le problème est analogue à celui du tir à la 
cible. 

Les points se répartissent 
conformément à la loi de Gauss 
généralisée. 

Les courbes P=const. seront 
des ellipses concentriques ayant 
les mêmes directions d’axes. 

Considérons l’une de ces 

Fig. rj. 

ellipses : je mène par O plu¬ 
sieurs droites qui partagent le plan en secteurs, i, 2 , 3, 4- 

Soients, la partie intérieure à l’ellipse du premier secteur, 
S t la partie extérieure. 

S’il y a un très grand nombre de points de chute, ils se 
répartiront à peu près proportionnellement àleurs probabi¬ 
lités. Dans il y aura n v points, dans S t il y en aura N t . Le 
théorème qui résulte immédiatement de la formule est le 
suivant: 

n j _ /ij ti$ 

NT ~ Ni = 1; = nT 

Dans chaque secteur, il y a le même rapport entre le 
nombre des points intérieurs elle nombre des points exté¬ 
rieurs à l’ellipse. 



160. Si les observations sont indépendantes, (p est le pro- 
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duit de deux fonctions. P sera alors la somme de deux fonc¬ 
tions dépendant cliacnne d’une seule variable; donc le terme 
en £ t 75! disparaît. 

Cela veut dire que les ellipses ont leurs axes parallèles 
aux axes de coordonnées. 

Pour que l’écart entre le point visé et le point observé 
soit indépendant de la direction, l’ellipse devra se réduire à 
un cercle. 

On pourrait encore regarder comme indépendantes l'er¬ 
reur en abscisse et l’erreur en rayon vecteur. 

C’est là-dessus qu’était basée une démonstration de la loi 
de Gauss, déjà citée au paragraphe 16, et dépourvue de 
valeur. 
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161. La méthode des moindres carrés sert à déterminer 
des quantités u u u 2 , u p qu’on ne peut mesurer directe¬ 
ment, mais dont on mesure certaines fonctions z 2l z n , 

k 2 , ..., Kp), 

-*2 • • •? 

. * . » 

Z n - ïl 2 y . . - , Kp). 

Pour Tes mesures de s,, s 2 , z n , n observations ont 
donné ï 1 ,i ! ..,,®„;oaa commis des erreurs. Sur s t l’er¬ 
reur y t est 

Yi= ooe—Zi. 

Le problème ne se pose que pour n> p, car pour n=p 
le système d’équations donne une solution unique ; pour 
n<.p, il n’y a pas assez d’équations, et le problème est 
indéterminé. 

Pour n>p, il y a trop d’équations : quelles sont alors 
les quantités les plus convenables à prendre pour les «? 

Éliminons les p quantités u; on est conduit à n —p équa¬ 
tions 

• • •» z n) = — r = i, 2 , .., } n p. 

Ce sont les équations de condition. 
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On a parfois avantage à prendre les équations de condi¬ 
tion sous celle forme. 

Parfois il est préférable d’exprimer les z en fonction 
des u. 

Nous traiterons un exemple avecl’une et l’autre méthode : 
le premier relatif aux planètes, le second à un problème de 
triangulation. 

162. La première partie de la méthode des moindres 
carrés, que nous abordons immédiatement, est de déter¬ 
miner les valeurs les plus convenables des u. Dans une 
deuxième partie, nous nous occuperons de l’erreur com¬ 
mise. 

La cause inconnue est que les quantités u soient com¬ 
prises entre certaines limites; les quantités observées x t 
sont elles-mêmes comprises entre certaines limites. Appli¬ 
quons une fois de plus la formule 

Pi™j . 

rs[ est la probabilité a priori pour que la cause ait été mise 
en jeu, c’est-à-dire ici pour que les quantités «soientcom¬ 
prises entre u l et du lf « 2 et k 2 -i-«/k 2 , .... u p et Up+dup. 
Celle probabilité peut se représenter par 

ij>(«i, « 2 , u p )du i du i du p . 

<J/ aura des formes variées suivant l’idée qu’on se fera 
a priori des quantités « : il y a là un très grand degré d’ar¬ 
bitraire. 

Pt est la probabilité pour que x t soit comprise entre x t et 
xt + dxt, en supposant que les u aient eu les valeurs que 
nous leur avons attribuées; s u z t , ..., z n étant données en 
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fonctions des u, la probabilité de l'erreur commise sur 
chacnne d’elles sera respectivement 

?I (j't ) dyi = ® — z l ) dx u 

<Ps (ja ) dy* — ® (a* s — -2 ) ^« 2 , 


<p» (j«) rfr»=<?(■»«— s» ) 

La probabilité />; que nous cherchons est celle pour 
laquelle toutes ces circonstances se produisent à la fois ; 
c’est une probabilité composée : 

Pi = ?L (ri ) ®2 (rs ) • • • ?» (/*) dy\ dy 2 .. ; . 

J’abrège un peu l’écriture en posant 

du t du *... du p =. du, 

et d’autre part 

<?i(ri) ® s (r2) • • • ?«(/» )=n, 

dfi dy 2 dy a =dx t dx ,... 


Alors 


piïïi= IIi|/ du du' 


et 


PiVSi _ Ilij; du du' 

* Ptm j'ü.tydudu' 


Comme on n’intègre que par rapport à du, du’ disparaît. 

Telle est la probabilité qu’il s’agit de connaître, à savoir 
la probabilité a posteriori pour que u t soit compris entre «, 
et ui + dui. Celte probabilité, puisque le dénominateur est 
constant, est proportionnelle à n, fonction des u, et à 
qui représente la probabilité a priori et qui est aussi fonc¬ 
tion des u. 
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163: Pour obtenir la valeur la plus probable des quan¬ 
tités u, il faut chercher le maximum de Htyda. 

L’hypothèse la plus simple sur 4 1 est if 1 = r : reste à déter¬ 
miner le maximum de IL 

L’hypothèse la plus simple sur les (j> est que les erreurs 
suivent la loi de Gauss. 

?*(/*) = y^e-*»'î. 

Alors 

Il = C 

II sera maximum qnand la parenthèse, c’est-à-dire 
h\y\ + iny\ -t-... h- h n y%, 

sera minimum. 

C’est une fonction connue des u : les quantités k lt h 2 ,..., h n 
représentent les poids des observations, et ce qu’il faut 
rendre minimum, c’est la somme des carrés des erreurs 
commises, chaque carré étant multiplié par le poids de 
l’observation correspondante. 

164. On arriverait au même résultat sans admettre la loi 
de Gauss, pourvu que l’on suppose les erreurs accidentelles 
petites et les erreurs systématiques nulles. 

En effet, supposons les quantités y très petites : quelle 
que soit la forme attribuée aux fonctions a, nous serons 
amenés à quelque chose d’analogue. Il s’agit de rendre 
maximum le produit des tp t -. 

Je suppose <p/ paire, et je développe par la formule de 
Taylor log©*- changé de signe. 

— Iog<Pi(ji) — a l ^-b l y\+c l y\+..., 

— IoS? 2 (j 2 ) = a 2 +-b 2 y\ H-Cjjl-f-..., 


— log <p„ (y n ) —a n + b n yl+- c a y * a -+-.... 
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La somme des logarithmes, changés de signe doit être 
minimum, c’est-à-dire 

+ 2C//ÊH-.... 


Je différentie par rapport à u k : 




O. 


Comme les y t sont supposés très petits, on peut en négli¬ 
ger les puissances supérieures, et tout se passe comme si 
nous avions à rendre minimum En admettant donc 

que la loi de Gauss ne soit pas vraie, la véritable loi n’en 
sera pas très différente dans Vintervalle utile. 

De deux choses l’une, bu bien les observations sont sensi¬ 
blement concordantes, et, comme nous venons de le voir, 
la méthode des moindres carrés sera applicable; ou bien, 
elles ne sont pas sensiblement concordantes, et dans ce cas 
les observations ne vaudront rien et il n’y aura rien à en 
tirer. 


165. Nous ne saurions cependant nous contenter du rai¬ 
sonnement qui précède, car ce que nous voulons obtenir, 
c’est la valeur probable des u (et non la plus probable). 

La probabilité pour que æ soit compris entre æ et x-\-dx 
étant <p(a;) dx, la valeur la plus probable de x est celle qui 
rend maximum <j> (x ) dx. 


La valeur probable de x est 



dx. 


La valeur probable de « étant u 0 , la valeur probable de la 
fonction s. 


; = tr 


ne sera pas «J. 

Mais si les'z sont fondions linéaires des u , les valeurs 
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probables des z correspondent aux valeurs probables des u, 

■s £ -= A/l H- À/j Ma H - • • • H - Afp u p H- B/. 

Cn«?« représente la probabilité pour que la t Èmo quan¬ 
tité u c soit comprise entre «/ et u ( + dui. 

Soit u% la valeur probable de u k . 



La valeur probable de z /, soit s}, sera 


z® —Cn^A/i«iH- A/2 n% H—.. - H- A ipUp h- B/) d(x> 

ou 

5/ — A/i en a, do ,3 -j— A/ 2 ^^ GH/ig dcù H—... 

+ A ipj' CHtf.,, dht + B/ J' C TLd(ù, 

et comme J Cn«?w est la valeur probable de l’unité, c’est- 
à-dire i, 

■5/ — A// u J h- A/g ((’+... -t- A t - p iip h- B/. 


166. Je vais supposer d’une part tji constant; d’autre part 
que la loi des erreurs est celle de Gauss ; enfin que les s 
sont liées aux u par des relations linéaires. 

Je vais établir que la valeur probable des u est celle qui 
est donnée par la méthode des moindres carrés. 

Le produit p ( is £ atteint son maximum quand la fonc¬ 
tion P 

P = /l ifï H- Aîjf -t-... H- h n yl 

est minimum. 

Soient «5, u\, ..., «° les valeurs des u qui rendent celle 
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expression minimum. Ces valeurs seront aussi, comme nous 
allons le voir, les valeurs probables des u. 

On a 

n=ce- p . 


La valeur probable de u k est 



Il d(t> 


■ Uk= 


fnu k 


dû) 


nrfa) 

Il faut démontrer que 


Il do) 


c’est-à-dire 


On a 


I 

r n u k du 

“A-- - J. > 

/ nrfca 

J' H(u k — u\)dû) — o. 
yi—~ 2Ci 


Xi est connu, z t est du premier degré par rapport aux u : 
P est donc un polynôme du second degré par rapport aux u. 
P atteint son minimum quand 

«i — «J, « 2 = •••> U A =u% . 

Cela veut dire que 

P = P u + P 2 , 


P 2 étant un polynôme homogène et du second degré par 
rapport a (u, — w,), (^2 %)» •••) %)i •••> Po 

étant la valeur de ce minimum. 

Nous avons à démontrer que 


Ce“ p »e“ p =(H*— u%) dû) = o. 
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Ce -p »e _p = est une fonction paire des quantités 
u k — u% est une fonction impaire. Comme l’intégrale est 
prise de —» à ■+•*>, elle est bien nulle. 

Ainsi ces valeurs des u sont non seuiementles valeurs les 
plus probables, mais les valeurs probables. 

167. En général, en est-il ainsi? 

Si les opérations sont sensiblement concordantes, les 
erreurs sont petites, et tout se passera comme avec la loi de 
Gauss. 

Quelle que soit la forme des fonctions F, si le champ de 
la variation des u est très restreint, nous pourrons regarder 
les x comme linéaires. 

Pour celle même raison, c'est-à-dire si le champ où peu¬ 
vent varier les u est très restreint, la fonction tji, qui était 
d’abord si arbitraire, peut être regardée comme constante. 

C’est grâce à cet ensemble de circonstances que la mé¬ 
thode des moindres carrés peut être considérée comme 
applicable, toutes les fois que les observations sont sensi¬ 
blement concordantes et dénuées d’erreurs systématiques. 

168. Ceci posé, voyons comment les calculs doivent être 
dirigés. 

Nous connaissons les fonctions z des u u ceux-ci sont au 
nombre de p, et un nombre d’observations n, plus grand 
que p, nous a donné pour z u z 2 , ..., z tl les valeurs 

Il y a plus d’équations que d’inconnues ; cherchons la 
meilleure manière d’y satisfaire d’une façon approchée. 

Une première approximation donnera u t , « 2 ,..., u p . Sup¬ 
posons qu’elle soit assez bonne pour qu’on puisse négliger 
le carré de l’erreur commise: soit b { celte première approxi- 
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maiion pour u t : 


u t — o e . 


- 24 'i 


Si nous développons, les s t suivant les puissances crois¬ 
santes des (’i, d’après la formule de Taylor, et en négligeant 
les carrés des o tl 

•s,— Ajj (>i -+- Àj 2 rj + ...+À/p Vp h- B,-; 


on aura de la sorte n équations qui sont devenues linéaires. 
Il faut rendre minimum 

2 h t y} = l i h i {s l — xi)'-. 

Ecrivons que les p dérivées par rapport aux p quantités 


Ou o 2 , ..., 

o p sont nulles : 



Or 

gja. 

II 

>■ 

& 

il reste 



2 ( z 1 xi) —o. 


169. Nous sommes donc conduits à la règle suivante: 
J’écris les équations ci-dessous qui ne sont qu’approchées : 


— Au (’i 4- Au^2H-. • • "+" Ai p Vp 
— 1 B2 A21 (’i H— A22 0 2 H— .. « H— A 2 p (’p 

&n—rtën = A-nl< > l-±'&. ni V 2 -l-. . .4-A„pPp 


Ai Au, 

A* Agi, 

.J 

A»Ani* 


Non seulement ces équations sont approchées, mais elles 
sont incompatibles puisque n>p. 

Je multiplie les deux membres de la première par h 2 A a ; 
ceux de la seconde par h 2 k 21 ; ... ceux de la n iÈme par h n k nl 
et j’ajoute les résultats membre à membre. 
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J’obtiens ainsi une première équation linéaire en æ et v ; 
je me suis servi des coefficients 

Z?^- j . k n A, lk 

où j’ai fait k = i. Si je fais k égal successivement à 2 , 
j’obtiendrai les nouvelles suites de coefficients 



/i 2 Â 2 2, 

• • • 9 

ktA-ip, 

* S. 

SI 

• * * 9 


et par conséquent p équations linéaires pour les v. 

La résolution de ce système répond au problème. 

170. Je dirige le calcul autrement. 

J’ai n fonctions z e de «„ u 2 , ..., u p : 

R/—n 2ï ,.Wp). 

Je puis éliminer les u ; d’où n — p équations, qui sont les 
équations de condition, 

<Pl s i> ■ * •> s n.) ~ °> 

Ÿ2 ("lJ z 2) ■ • • > z n ) — °> 

..* * • } 

fg(. z H z Z> ■ ' • J z n) — °> 


en posant q = n — p. 

Je puis développer les équations de condition, en négli¬ 
geant les termes du second degré par rapport aux / si les 
observations sont suffisamment concordantes : 

A-ii . .H- A lre /„=Bi, 

À2L/1 -h À22/2 * • • ■+" A. 2 b/* — B 2j 

••••••..'. 

■A.ji/i- 1 -^2/2 + — 
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Quelle est la meilleure manière de satisfaire à ces équa¬ 
tions de condition? C’est en rendant minimum 

Donc 

^h t y £ dy £ — o. 

171. Il faut observer que dy x , dy 2 , ..., dy n ne sont pas 
indépendantes: elles sont liées par les relations qu’on obtient 
en différentiant les équations de condition. 

Ces équations de condition ont pour forme générale 

A A k£ y £ — B^, 

d’où 

2A k£ dy £ —o. 

Les relations qui lient dy t , dy 2 , ..., dy n sont donc 

lA l£ dy £ =o, 

2 A 2£ dy £ — o. 


et 


2 Agi dy £ — o ; 
2h £ y £ dy £ =o 


doit être une conséquence de ces q équations. 

On devra donc avoir (les s étant des coefficients indéter¬ 
minés) 

h £ y £ — e l À J £-t- s 2 A 2£ +. . .H- SqAq £ . 


On déterminera les s en transportant dans les équations 
de condition la valeur des y £ en fonction des e; la première 
deviendra 


C^A-u-f- e 2 A 2l H- — + £ ? A r/1 ] 

-l—^r— [siAi2-f- £»A 2 2-l-.. .-t- s ? A ? 2 ] = B l? 
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et l’on aura de cette manière q équations pour déterminer 
les s. 

Telle est la seconde solution du problème. 

172. Prenons deux variables et quatre observations. 

Les deux équations de condition seront 

Ayi -t- B j 2 -t- Cy 3 -t- D = H, 

•A-'yt h- B '^2 -t- C'j‘ 3 -+- B’yt — H'. 


Je suppose mêmes poids k I = h 3 =k 3 =: /i 4 , 
Ji=Aei-h A'£ 2 , 

y »—Csj -t- c f £ 2} 
J'* = De 1 -hD , e 2 . 


Les équations en s, après la substitution des y dans les 
équations de condition, seront 

(2A*)£, +(2AA')£ 2 =H, 

(2AA')eiH-(2A' j )e 2 H'. 

Des deux méthodes indiquées, l’une, est plus avantageuse 
que l’autre suivant les circonstances. 

La difficulté est la résolution de nombreuses équations 
linéaires; lé but à atteindre est d’en avoir ié moins pos¬ 
sible. 

Dans la première méthode, il y a p équations ; dans la 
seconde, il y en a q = n — p. On emploiera donc la première 
si «est plus grand que 2 p, la seconde si n est plus petit 
que 2 p. 
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173..Nous avons cherché à rendre minimum 

a;)*, 

où h{ est le poids de l’observation i. 

On peut ramener le problème au cas où tous les poids 
sont égaux. Posons 

z'i = Si\fhi= \/Âi-Fj(a„ « 2 , .. u p ) 
et 

Xisfîii-, 

alors 

filial— x i )-—(\fh i z i — </h i xi) 2 = (s'i — xli) 1 , 
et l’on a à rendre minimum une expression telle que 

2(s { — Xi) 2 . 

174. Nous avons vu qu’on pouvait diriger les calculs de 
deux manières. Voici un exemple de chacune. 

Premier exemple. —On observe un point M d’un certain 



nombre de stations S t , S 2 , S 3 , ..., dont la position est par¬ 
faitement cônpue; on mesure l’angle de MS^ par exemple, 
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avec une direction fixe MS 0 , en d’autres termes l’azimut 
de M, soit <p t ; et ainsi de suite. 

Quelle est la position la plus probable du point M d’après 
ces visées ? 

Soient x, y les coordonnées de M; a t , b t celles de S,-; 
<p t l’angle deMS,-avecMS„ pris comme axe des abscisses : 

y — b ( 

<p ; =arctang^—-• 


Les équations en œ, sont, en général, incompatibles, les 
lignes de visées ne passant pas exactement par M et for¬ 
mant autour de ce point un petit polygone. 

Un point quelconque pris à l’intérieur de ce polygone 

sera une première approxima¬ 
tion, Mo(<r 0 , Jo). Je pose 

X — X a -fc- X> ■ 

y==y 0 -hri; 

X et v) seront de très petites 
quantités. 



Posons 


<P 


(Dans le cas de la figure 19 , serait négatif.) 
D’ailleurs 


<p? = arc tang 


./o— b i 


Développons <p,- suivant les puissances croissantes de \ 
etn, en nous arrêtant aux termes du premier degré : 

„ , '0 (x 0 — a { ) — X(.Ya— M 

?£ + ( Æq _ a ^ h- ( J» — bi)- ’ 
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Soit 

A .__ yo—bi 

* (&o— a e ) % +(y 0 — &/)*’ 

n _ 0 

L ~ (^0 — diY H- ( y a — bi) x 

Alors 

«/= <pI— <p? — A/| H- B/ïi. 

La valeur observée de <p £ - est tpi» 

’pi= <P° + e £ . 

s £ - sera la valeur observée dé w £ . Les équations que 
donnent les observations seraient les suivantes : 


£/ = A/| + B/ï). 


Ces équations sont, en général, incompatibles, parce que 
les observations ne sont pas exactes ; il faut choisir |etn de 
façon que 

2(A/| ■+• B/ï) — E /) 2 

soit minimum. 

Je dififérentie par rapport à | et à yj : 


2 A/( A/| H- B/ïi — £/) — o, 

2 B/(A/| -t- B/Y) — £/) = 0 ; 

d’où deux-équations linéaires pour déterminer | et n, 

|2A ! -+-yi 2AB =2As, 

|2ABh-y)2B 2 =2Be. 

175. Deuxième exemple. — Supposons qu’on ait mesuré 
neuf angles : soient z t les valeurs de ces angles, æ t les 
valeurs observées, y t les erreurs. Imaginons qu’on ail entre 
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ces neuf angles les quatre relations de condition 

■Si -+* Zz -+- %3 — 7T, 

S 4 “t - Sg H— Z g 7T, 

S 7 H- S 8 •+• Z 9 = 7T, 

■3*3 H— S 4 + Zi~=- 2 71. 

/i t étant une quantité très petite donnée par l’observation, 
l’excès sur deux droits de la somme des angles observés, 

CC 1 H— '^'3 —— -4- hf 3 

d’où 

yt+-yz+-ys=ih- 

De même 

y^j!s+y«— h, 

77 + 78 + 79 = ^ 3 - 

La quatrième équation de condition exprime que 

73 + 7i + j7=*4. 

Il s’agit de déterminer les 7 de façon que la somme 
soit minimum. 

Je vais introduire quatre quantités auxiliaires, s u e 2 ,e 3 , e t , 
correspondant aux quatre quantités k u h 2 , h 3 , A t . Ainsi, 
pour j 3 , je me servirai du coefficient de 7 3 dans la première 
équation, où il est 1 , puis dans la deuxième, puis dans la 
troisième, où il est 0 , puis dans la quatrième, où il est 1 : 

73 : = £ 1 + £ f 

On trouve de même 


7i=rs= £ ii 

7î=7«=. £ s> 

78 = 79 = £ 3 > 
77 = £ 2 + £ 4i 
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Pour déterminer les e, je remplace les y par leur valeur 


3£(*4“ — Ajj 

3 £2 “ 1 “ £4 - — 


d’où 

et 


3 £3 + £4 — A 3 , 

£1 4 - £2 H- £3 -H 3 £4 = A4 ; 

3 (£i 4 - £2 + £3) 4 - 3 £4=: A, 4- A 2 4 - A3 


ôe 4 = 3 A4 — A j—A 2 — A 3 , 


et ainsi de suite. 

Ce procédé est ici plus commode que l’autre. U y a neuf 
angles et quatre équations de condition, d’où cinq arbi¬ 
traires ; nous avons eu à résoudre quatre équations à quatre 
inconnues, et par l’autre méthode nous aurions eu cinq 
équations à cinq inconnues. 

176. Autre exemple. — On a visé un certain nombre de 
points Mi, M’ 2) ..., M„ qui ne sont pas en ligne droite et qui 
devraient l’être : quelle est la droite la plus probable? 

Il s’agit de déterminer « nouveaux points on ligne droite, 
de telle façon que la somme des carrés des erreurs soit mi¬ 
nimum. 

L’erreur est double : elle porte sur l’abscisse et elle porte 
sur l’ordonnée. Si je suppose que la probabilité d’une erreur 
sur l’abscisse soit la même que la probabilité d’une erreur 
sur l’ordonnée,; la somme des carrés des erreurs sur l’abscisse 
et sur l’ordonnée sera la somme de quantités telles que 

MÏPÏ- 


Nous avons besoin, en réalité, non des points P,-, mais de 
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la droite P qui passe par les points P,- : je dis que M £ -P £ - doit 
être perpendiculaire à D. 

Si elle ne l’était pas, soitM/P/ cette perpendiculaire; en 
remplaçant M £ P £ - par Mj-PJ-,- je diminuerai la somme qu’il 
s’agit de rendre minimum, et par conséquent elle n’était pas 
minimum. 

Je ne m’occupe plus des P : je vais chercher une droite 
telle que la somme des carrés des distances des points M £ - à 
cette droite soit minimum. 

C’est le moment d’inertie des points par rapport à cetle 
droite qu’il faut rendre minimum, en supposant que chacun 
des points ait été affecté d’une masse égale à i. 

Comme première propriété, la droite passe par le centre 
dé gravité. Si l’on fait tourner la droite, on sait que le mo¬ 
ment d’inertie varie suivant une loi très simple, qui amène 
à la définition de l’ellipsoïde d’inertie. Ici, cet ellipsoïde 
serait infiniment aplati, puisque les points sont dans un plan ; 
la droite est donc le grand axe de l’ellipse à laquelle il se 
réduit. Celte ellipse d’inertie serait d’ailleurs une ellipse très 
allongée, puisque les points sont sensiblement en ligne 
droite. 

177. Dans le cas où l’on vise un point dans un plan, la pro¬ 
babilité d’une erreur en abscisse peut n’être pas la même que 
celle d’une erreur en ordonnée. Les deux erreurs peuvent 
aussi ne pas être indépendantes. Nous avons étudié ce point 
en détail dans le Chapitre précédent. 

Nous avons été conduits à considérer, dans le cas du point 
visé, une série de petites ellipses; la probabilité que les 
coordonnées du point soient comprises entre x et x dx, 
y et y-k-dy, s’est exprimée par une fonction 

e p dx dy. 
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et le polynôme du second degré P, égalé à une constante, 
nous a donné l’équation d’une de ces ellipses. 

Revenons aux points en ligne droite. 

Du point Mj comme centre je décris une ellipse homothé¬ 
tique à l’ellipse norrhale, et tangente à D. Je fais la somme 
des carrés des grands axes des ellipses ainsi décrites autour 
des divers points M, et j’écris qu’elle est minimum. 

Ce cas se ramène aisément au précédent. Par une trans¬ 
formation homographique, ces ellipses peuvent devenir des 
cercles. Si, par exemple, le petit axe est la moitié du grand 
axe, on multiplie toutes les abscisses par 2 , et l’on n’a plus 
qu’à chercher le moment d’inertie comme tout à l’heure. 



CHAPITRE XIV. 

CALCUL DE L’ERREUR A. CRAINDRE. 


’ 178. Admettons la loi de Gauss. 

Un certain nombre d’obs"ervations nous.’ont donné comme, 
résultats de mesure x t , x 2 , ..., æ n . Il s’agit de savoir la 
valeur de h et eelle de s : tout ce que nous connaissons, 

c’est x u x 2 . x n , et de plus nous admettons que la loi des 

erreurs est celle de Gauss. 

Posons 

Xi—s — yi. 

Demandons-nous la probabilité pour que s soit compris 
entre s et s-k-ds, et pour que h soit.en même temps com¬ 
pris entre A et A H- dh. 

C’est un problème de probabilité de cause : la cause 
inconnue, c’est le double fait ci-dessus; l’effet connu, c’est 
que n observations ont donné x u x 2 , ..., x n . 

En représentant, comme précédemment, par cu-Ia proba¬ 
bilité a priori de la cause envisagée, et par p t la probabilité 
d’un événement qui s’est produit si l’on admet que là cause 
a été mise en jeu, la probabilité a posteriori de la cause 
sera 

&tpi 


Ici 


Tn t = '{'(s, h) dzdh. 
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sous la forme la plus générale et sans faire 4 I = 1 : l’idée 
que nous nous faisons a priori de l’habileté de l’observateur 
doit influer sur la probabilité que nous altribuons à h. 

Pt e st la probabilité que les observations ont donné des 
résultats compris entre 

<37, et <37J H - do <37j et X 2 “H dx 2 y ■ • < j <37 , £ et OC n H - dXji. 


Posons 


où 

alors 

et 


n = <p (a7j — z) tf (x t — z) . . . <P (x a — z), 
<p(27 £ < z) = y/ ^ g—h(Xf—Z)*. 


Pi= Il dx i dx 2 ... dx n , 

rüiPi Ilijj ds dh dx^ dx 2 ... dx„ 

P 1 J* H't|j ds dh dx v dx t ... dx n 


On n’intègre pas par rapport aux x, dont les différentielles 
disparaissent haut et bas. Par rapport à z, on intégrera de 
— » à -f- », et par rapport à h de o à -h». 


179. On peut écrire 


si 


11 = 



e 


-AP 

‘ 9 


P = (x t — z) 2 -h (x 2 — z) 2 -h... + (x a — z) 2 . 


P est un polynôme du second degré en z qui atteint son 
minimum quand z est la moyenne arithmétique des quan¬ 
tités ou; représentons ce minimum, qui est positif, par nu 2 . 
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Je pose 

X\ -H x 2 -H... -H Xn 
y=z. z — ” 7 

J n 

d’où 

n 

et 

P = «(/ 2 h- «*). 

Alors 

rssfpi 

2® ipi 

devient 

n 

h 2 e-’^r'+^l^dydh 


J h 2 e~ n,tl y ,+al ^dydh 

Pour y, comme pour z, on intégrera de — *> à h- *>. 

180. Cherchons la probabilité, pour h seulement, d’être 

compris entre 

h et h + dh, y ayant toutes les valeurs 

possibles, 

n 


dh I h 1 e -"'‘(y’+ a '> ij; dy 

t 

« ✓,-*-*> n 

j dh I ^a e ~«/iCr 3 +a *)tydy 

'0 J —co 

i}' dépendait de æ el A; il dépend maintenant de y et h. 
Restreignons d’abord le problème en supposant toutes les 
valeurs de y également probables, c’est-à-dire 4 1 indépendant 

de y. 


On a 


J e~ n '‘(y'+x'-) dy — e- nàa 'j e -nhy> dy = e~ nha? y/• 
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La probabilité relative â h seul devient alors 


n —1 

dh.h 2 e~ nA8 *i|; 



n— 

dh.h 2 


i 

e-nh&ty 


181. Quelle est d’abord la valeur la plus probable de A? 
Cherchons le maximum du numérateur, puisque la proba¬ 
bilité lui est proportionnelle. 

Ce numérateur peut s’écrire 

dh^L(\fhe- h « i y. 


Or le maximum de dh<è n -x f a lieu en général quand 
/' 

f 

et, si n est très grand, on peut négliger y; le maximum est 

donc atteint en même temps que celui de 
Ici $ est \fh écrivons que la dérivée logarithmique 

est nulle i 


r 

2 h 


■ <x* = o. 


On a ainsi la vàleur la plus probable de h. 

On remarquera que, en supposant un nombre très grand 
d’observations, la fonction arbitraire i|> n’intervient pas. Ce 
n’est pas étonnant : l’hypolbèse que nous avions fondée 
a priori sur le plus ou moins d’babileté de l’observateur 
disparaît devant le grand nombre de résultats que nous 
contrôlons. 
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182. Quelle ésl la valeur probable de Celle valeur 
probable est 


,ee- Tl — î 


f h P+ 2 e-^^ 'dh 

"0 _ 

J *% ce n —l 

■ h 2 e _n/ia ’t \}dh 

IX 


ou 


dh 


f hPf® n 

d(j _^_ 

f dh 

dp 

Si n est très grand, nous savons vers quelle limite tend 
le rapport de ces deux intégrales; c’est 


IiUiK) 

/(/»«) 


■ K, 


kp étant la valeur la plus probable. Ainsi la valeur probable 
de Iip est h$. 

Celte conclusion n’est vraie qu’à la condition que n soit 
très grand et que p soit fini. 

Faisons <|> = i: nous arrivons à des intégrales eulériennes 


hp = 


/ 


9 Tl —1 

Il + 2 e -nfta* 


‘“_ r 0 ’ +i r i )(. 


a 2 )' 


-p -■ 


f. 


j n —l 

h 2 e~ nha? dh 




(ned) 


n- i-l 
2 


Le rapport des : valeurs asymptotiques donne 



( n a 5 )~P ~ 



y 


ce qui est bien notre conclusion. 
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Mais, si l’on ne suppose pas p fini, elle ne serait pas appli¬ 
cable. Supposons p très grand, égal à ^ par exemple : 


r(2 p) 

1 \p) 


(/ia s )-E 


( 2 pV p e* p '/bÿ 

pPe~P\j2.Ttp 


Le second membre se réduit à 2 p e~? sfô. (a?)-*’. 

On trouve donc pour la valeur moyenne de hP une 
expression très différente : 


%p.erP\fi 

W-) p 


ou 



183. Probabilité de l’erreur' commise. — Le problème se 
divise en trois : 

i° On peut se proposer de calculer la probabilité a priori. 

On n’a pas encore fait les observations; on sait seulement 
qu’on va en faire n et qu’on appliquera la méthode des 
moindres carrés. Nous connaissons aussi l’habileté de l’ob¬ 
servateur. 

2 ° Le problème est entièrement différent, si nons ne savons 
pas à l’avance la valeur à attribuer à la constante qui entre 
dans la formule de Gauss. Nous ne connaissons pas l'habi¬ 
leté de l’observateur, mais nous connaissons les résultats 
des observations. 

3° Nous connaissons l’habileté de l’observateur et les 
résultats des observations. 


184. Premier problème. — On ne connaît pas les résultats, 
mais on connaît l’habileté de l’observateur. On suppose 
alors que le poids est le même. 

Soient yq, 7 *, ..., y n les erreurs qu’on va commettre; 
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at u x t , ..., sc n seront les valeurs approchées des quantités 
vraies s 1} z r ,s a . 

Celles-ci seront liées par q = n—p équations de con¬ 
dition : 

$/(* U 2 ï> — O. 

Si l’on substitue à z t , ...,£„ les quantités «i, æ n , 

ces équations ne seront pas satisfaites, et l’on aura 

-*2, • • •, ■*«.) = yt, 

où y,- est très petit. 

Je remplace a:* par y k z k , et je développe suivant les 
puissances croissantes de/*, en m’arrêtant aux termes du 
premier degré : 


Ai/i A n y n —yt. 

Pour fixer les idées, faisons n = 3, et supposons qu’il y 
ait deux équations de condition 


Aiji-b As/a-H A3/3 — p» 

Bl/l-t* B2/2'+'®3.r3 — 

y, p.' sont très petits, mais je ne connais pas leur valeur, 
puisque les observations ne sont pas faites. 

Il s’agit de calculer les corrections y £ à effectuer sur les 
valeurs observées x £ ; les corrections dépendent évidemment 
de p et de p', et nous aurons, par exemple, 


yi=Q(y,y')- 


Je ne connais pas la forme de 0, mais je puis développer 
suivant les puissances croissantes de y et de p', et, comme 
les p sont très petits, négliger les carrés des p; je serai con- 
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y i ^ ^1 p “t" ^1 p y 

ÿ 2 = *tp-i-Kl J -'> 
y 3 =i 3 p-i-y 3 p', 

en général 

y i - l'ip “1“ l'i /A ! 
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les 1 étant des constantes à déterminer. Gauss les déter¬ 
mine de façon que la valeur probable de (y t -— y'-) 2 , c’est- 
à-dire de 

( 7 i— hp — 

soit minimum. 

Il s’agit de la valeur probable en supposant que l’on con¬ 
naisse d’avance Vhabileté de l’observateur, mais nonles résul¬ 
tats. Si on connaissait les deux, la solution serait en général 
différente. 


185. Pour bien faire comprendre cette différence, je vais 
examiner le cas le plus simple : on a observé plusieurs fois 
la même quantité z. 

On prend la moyenne des observations, ce qui est con¬ 
forme à la méthode des moindres carrés. 

L’erreur commise sur la moyenne sera 

y i —i y 2 —i * * * —i y n 

n 

La probabilité a priori de l’erreur commise, pour la pre¬ 
mière observation, par exemple, sera <p (y t ) dy^. 

La probabilité a priori pour que z soit compris entre z et 
z H- dz sera t{i (z) dz. 

Cherchons la valeur probable de 
quand on ne connaît pas les résultats des observations, et 
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qu’on connaît t{>, 


.r t -4-.r a -4-.-.H-y» y 

X ?(7i) ?(y 2 )- • ■?(?») dy,. dy ^.. .dy n . 



C’est la première valeur probable. 

Si l’on connaît à la fois l'habileté de l’observateur et les 
résultats, on a une deuxième valeur probable très différente 


B 


Jk 


n 


—'j ®(ji) <P(7*) • • • ?(v„) +(*) ds 




Dans le premier cas, on avait affaire à n variables indé¬ 
pendantes jKijJ's, ...j/n d’où une intégrale multiple d’ordre re; 
dans le second, on n’a plus qu’une seule variable z. 

Supposons qu’au lieu d’appliquer la règle de la moyenne 
et d’adopter, par conséquent, pour z la valeur 

X\ -H «a?2 “ï“ - • • 3^71 


on ait adopté une autre valeur 




l’erreur commise eût été égale à 

yi-)-r s -!-.r« , „ 

-- “î— 6 . 

n 


Nous aurions trouvé alors pour la valeur probable du 
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carré de cette erreur sans connaître les résultats 

X © ( 7i ) <p ( y, )... <p ( y n ) dy t dy t ... dy n , 

et pour la valeur probable de ce même carré connaissant les 
résultats 

f (• ri+yg „~" +r " + e) ©(7i)?(7 2 ) — ®(7»)'{'(s)<^ 

j ?(7i 

Alors A atteint son minimum pour s = o, pourvu que la 
fonction <p soif paire. 

Au contraire, pour queB atteigne son minimum pour e=o, 
il faut que la loi de Gauss soit vraie. 

Gauss s’était placé au premier point de vue dans l’analyse 
que nous avons reproduite au Chapitre XI, paragraphes 129 
et suivants, et il avait ainsi démontré que la règle de la 
moyenne est toujours légitime. 

Il s’était placé au second point de vue dans l’analyse que 
nous avons reproduite au Chapitre X, paragraphes 108 et- 
suivants, et il avait démontré que cette règle n’est légitime 
que si la loi de Gauss est vraie. 

186. Revenons au problème qui nous occupe et cherchons 
à déterminer les X. Il s’agit de rendre minimum 

(Ji — — 

P- et p.' sont des fonctions linéaires des y; donc c’est un 
polynôme homogène et du deuxième degré, par rapport 
à 7i, 7*, .. -, 7n, qu’il faut rendre minimum. 

Par hypothèse, les poids sont les mêmes. 
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Soit ni 1 la valeur probable de y\ ; m? sera aussi la valeur 
probable de y\, et celle de y*. 

Si nous avions à faire trois observations, nous n’aurions 
pas le droit de supposer à l’avance y ± plus grand que_y, ou 
que y,. 

La valeur probable du produit y t y t sera nulle : elle sera 
le produit de la valeur probable de y t par la valeur probable 
de y 2 , et la valeur probable de 71 est nulle puisqu’il n’y a pas 
d’erreurs systématiques. Cela est vrai, parce qu’on ne connaît 
pas les résultats observés, et ne le serait plus si on les con¬ 
naissait. 

Comment trouver la valeur probable du polynôme? On 
remplace tous les termes carrés par m t , tous les doubles 
produits par o. 

Ce polynôme, si l’on substitue à p, et p' leur expression 
en fonction desjy, devient 

(ji — Xj A t y t — X' t y\ ) s ; 

le coefficient de y\ est (X^i + XjBt — i) 2 ; celui de y% est 
(XtAj-4- X'tBs) 2 ; celui dej 2 est (XtAj-f-XiBj)*. 

Donc (71 — X t p — Xjp ') 2 est égal à 

m 2 [(AiXi-t-BjXi—i^-i-fAaX^BjXj ^^(AgXj-f-BjXj)* J» 

Voilà ce qu’il faut rendre minimum. 

187. Appelons m i P le second membre : il représente la 
valeur probable du carré de l’erreur, (y t — y[ ) 2 , qui sub¬ 
siste après la correction. 

Égalons à zéro les deux dérivées 

dP _ dP 
d\ ~ dk\ ~ °’ 
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c’est-à-dire 

À-i (A t X t —i)-+-A 2 (A 2 X 1 4-BjX' 1 ) -i-A 3 (A 3 X! -j-Bs^j) = o, 

et, par symétrie, 

Bi (A) Xj -1-BiXj —i) -4-B 2 (A 2 X, -)-B 2 Xj ) -1-63 (A 3 X, -i-B 3 Xj) =0. 

Ce système peut s’écrire 

X,2A S -+- X', 2 AB = A„ 

X^AB-i-X'^B 5 =Bj. 

II est linéaire par rapport à X t et XJ. 

J’y ajoute l’équation qui donne y\ 

hF+KF'=/i- 

En éliminant X t et 

2 A S 2 AB A, 

2 AB 2 B 2 B, =0. 

F F' fi 

De là on tire y[, et l’on pourrait raisonner de même pour 
avoir y’ t et y': 

188. Telles sont les corrections à faire pour rendre 
minimum la valeur probable du carré de l’erreur après la 
correction. 

Elles sont conformes à la méthode des moindres carrés. 
En effet, y', y', y' vérifient : 

a i/i + A s/ü A 37' 3 = F> 

Biji -i- B 2 7 ' s B3/3 = ( 1' . 

Pour calculer les y', il faut çendre minimum la somme 
des y,*. 

Donc 


2/,rf/,= o. 
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D’autre part. 


'lk i df [ = o, 
2B/rf^=o. 


La première de ces deux équations doit être une consé¬ 
quence des deux autres; donc 


d’où 


et, par symétrie, 


fi= eAf-t- s'B„ 
e2A 2 -t- e'2AB = p, 

s2AB h- s'2B 2 = p'. 


En éliminant s ete' entre ces trois équations, 


2A 2 2AB p 
2 AB 2 B 2 p' 
Ai B t y t 


= o. 


Le déterminant est le même que le précédent. 

Ainsi le résultat est le même, qu’on applique la méthode 
des moindres carrés, ou bien qu’on fasse ia correction de 
façon à rendre minimum ia valeur probable du carré de l’er¬ 
reur après correction. 


189. On peut se demander maintenant quelle est celle 
valeür minimum : c’est celle de tw 2 P. La valeur de P peut 
être mise sous une forme plus simple. Rendons-Ia homo¬ 
gène, 

P —- ( Ai A, -j- BiXj — Xj ) s -t- (Az'ki -t- BoXj ) 2 —t— ( A 3 Xj — t— B 3 Xj) 2 , 
et appliquons le théorème des fonctions homogènes; on a 
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dP , 

Or —=~ et 

aÀj 


«rp 

dl' L 


sont nuis; !'[ 


i; il reste 


P 


aP = 


dP 

rfX';’ 


1 dp _ 

2 eft'J r 


-A 1 X 1 _B 1 V l . 


Le produit par m 5 est la valeur probable du carré de l’er¬ 
reur qui subsiste après la correction. 

Quand les observations deviennent de plus en plus nom¬ 
breuses, la valeur probable du carré de l’erreur va en dimi¬ 
nuant. 


190. Introduisons une quatrième quantité et une troi¬ 
sième équation de condition 

Ci/i-t- C 2i y 2 +• C 3 / 3 -t- G t r 4 =p.". 

Tout à l’heure nous avions à rendre minimum 

(0 (7i — Kp'T-, 

maintenant c’ést. 

(a) 

Il y a une indéterminée de plus, ; le minimum de 
l’expression ( 2 ) est évidemment plus petit que celui de 
l’expression ( 1 ); car il suffit de faire X'i = o dans l’expres¬ 
sion ( 2 ) pour retomber sur l’expression ( 1 ). 

191. Allons plus loin. Soit r l’erreur réellement commise. 
y étant la correction, y — y' est l’erreur qui subsiste 

après la correction. 

est la somme des carrés des erreurs commises; la 
valeur probable de cette somme est nm?. 
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Cherchons la valeur probable delà somme des carrés des 
corrections, 2y' 2 ; et la valeur probable de la somme des 
carrés des erreurs après corrections, 2 (y— y' 

192. J’observe que nous avons 

y' i — \ i p-\-'U i p! -, 

y est une fonction linéaire des p, qui sont des fonctions 
linéaires des y. Donc y' est une fonction linéaire des y. 

Ces fonctions y r ne sont pas linéairement indépendantes, 
car elles peuvent s’exprimer linéairement en fonction de 
deux d’entre elles, dans le cas présent, et en général en 
fonction d’autant d’entre elles qu’il y a de quantités p , c’est- 
à-dire de «—p d’entre elles, puisqu’il y a autant de p que 
d’équations de condition. 

Considérons les y t — y'- : ce sont aussi des fonctions 
linéaires des y, mais pas linéairement indépendantes; elles 
sont liées par les conditions 

Ai (ji— y'i) -i- A s (y 2 —/ 2 ) -+- A 3 (y 3 — f a ) = °, 
b i(7i—/ t)-+- B 2(72—/ 2 ) / 3 ) =°- 

Il y a ici deux relations linéaires; en général, il y en a p. 

Ainsi les y' s’expriment en fonction linéaire de «—p 
d’entre elles; et les y—ÿ en fonction linéaire d ep d’entre 
elles. 

193. Je dis qu’on a identiquement 

ïy,-y';=Zy?- 

En effet 

y*=eA/-t-e'B,-, 

Zyi/i— e2A / y l --t- e'2Bi .}'£= ep. -4- z'p', 

2j'- 2 = elAiy'i 4- £'2B,-y' = Efi + ëp'. 
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Autre identité 

2j 2 = 2 v n -*-l*{y — y') 1 . 

En effet, en développant 2(j— y') 2 , 

2/*= 2/ 2 + 2 7 2 - 2 ïyy' + 2/*, 

ce qui est bien une identité, puisque en vertu de la précé¬ 
dente identité 

2/' 2 — 2 2vy'-f-2 t y' 2 =o. 

— o 

194. Cherchons la valeur probable 2y' . C’est une forme 
quadratique par rapport aux y. 

On multiplie m i par la somme des coefficients des termes 
carrés, ou, autrement, on considère l’équation en S. 

Soient F et F' deux formes quadratiques par rapport à n 
variables; si S est une constante, 

F — SF' 

sera encore une forme quadratique par rapport aux n va¬ 
riables. 

En écrivant que le discriminant est nul, on obtient une 
équation d’ordre n en S, dite équation en S. 

La propriété de celte équation est de ne pas changer quand 
on fait un changement linéaire de variables : c’est une équa¬ 
tion invariante. 

Supposons maintenant que nous nous proposions de cal¬ 
culer la valeur probable d’une forme quadratique F; je 
prends F'— 2 y 2 . Écrivons que le discriminant de 

F-S2y 2 

est nul. 

La somme des racines de cette équation estla somme des 
coefficients des carrés. 
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Soit 

F = A y\ -i- A'/f 4- A" fl 4 - 2 B y 3 f 3 4- 2 Wy 3 y 1 4- 2 

Le discriminant donne 

A—S B" B' 

B" A'—S B =0 
B' B A"—S 
ou 

-S ! +(A4A'4A')S*-4... = o. 

La somme des racines est bien A 4 -A' 4 -A"; d’autre part, 
la valeur probable de 7 ? étant m? et celle defift étant o, 
celle de F sera 

tw s (A4-A'4-A"). 

Comme règle, on forme donc F—S hy 2 , on prend la 
somme des racines de l’équation en S et on- multiplie 
par m 2 . 

195. Appliquons ceci à la forme quadratique 2y 2 . 

Soit la forme 

<5 = 2/2—82^ 
ou, d’après le paragraphe 193, 

$ = (i-S)2ÿ' s -S2( 7 -/) 2 . 

Formons l’équation en S et cherchons la somme des 
racines. 

Les quantités y' s'expriment linéairement en fonction de 
n — p d’entre elles; 2 y ,s se décompose donc en une somme 
de n— p carrés, et l’on a, les £ étant des fonctions linéaires 
des y, 

Les 7 — y’ s’expriment en fonction de p d’entre elles, et 



CALCUL DE L’ERREUR A CRAINDRE. 


269 


l’on a, les ri étant des fonctions linéaires des y, 

2 (7— y ) 2 = ^ 1 m 1 -+- • • •+•«P- 

Les n fonctions linéaires ainsi obtenues sont linéairement 
indépendantes. Remarquons en effet qu’on a 

Le premier membre est une somme de n carrés 

J i» • • •» ./«> 

le discriminant de la forme du premier membre est 1 . Le 
second membre ne peut avoir pour discriminant o. On a 
ainsi 

3 = (i-S)2? ! -S2y) s . 

Le discriminant est 

(S — r)"~ p S p =o; 


n — p racines sont égales à 1 , et p égales à o, la somme des 
racines est n — p. 

• La valeur probable de JLy* est nm t ; d’après la règle expo¬ 
sée plus haut, la valeur probable de 1y % sera 

h y' 1 — ( n — pim*. 

Donc 

par différence. 

Ainsi : i° la valeur probable de la somme des carrés des 
erreurs commises est nm 2 ; 2 0 la valeur probable de la 
somme des carrés des corrections faites est (n — p) m* ; 3° la 
valeur probable de la somme des carrés des erreurs après 
corrections est pm 2 . 
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196. La valeur probable de 2,y' est plus petite que la 
valeur probable de 2y 2 . 

C’était aisé à prévoir. 

Nous cherchons à déterminer les corrections de façon que 
la somme des carrés des corrections soit minimum : c’est le 
principe même de la méthode des moindres carrés. 

A mesure que les observations augmentent, si nous con¬ 
sidérons l’erreur commise sur une observation, nous allons 
démontrer qu’elle tend vers zéro. 

Supposons que les observalionsaugmententconstamment; 
le nombre p demeure constant, ainsi qu epm 2 ; le nombre des 
termes va en augmentant: il y a des chances pour que chaque 
terme diminue constamment. 

Si nous considérons la plus petite des quantités (y k —y'*) 2 ,. 

elle sera certainement inférieure à 

n 

Observons une même quantité n fois; une seule variable 
indépendante : p= n. 

2 (y— yy-=m-. 

Nous avons n termes, n observations faites dans les mêmes 
conditions; donc 

-ITT mï 

( 7 -/)-= — 

197. Jusqu’à présent, nous avons supposé que la précision 
était connue, mais que les observations n’étaient pas faites. 

Le problème se pose autrement; on ne sait rien sur la 
précision, mais les observations sont faites. 

Nous voulons en conclure la valeur de h ou celle de m 2 . 

Voici la solution. 

Les y ne sont pas connues; lesj' le sont par la méthode 
des moindres carrés. 2y ,s est connu. 
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J’égale sa valeur à la valeur probable calculée a priori 
2ÿ* = (n — p)m*, 

d’où m 2 . 


198. Cette méthode a été critiquée par J. Bertrand. 

En effet, si on l’avait appliquée à une autre combi¬ 
naison, par exemple Sy' 4 , on en aurait déduit une valeur 
de m qui n’eût pas été la même. La méthode peut devenir 
suspecte. 

C’est un problème de probabilité des causes, et nous appli¬ 
querons les règles de ce calcul. 

On demande la probabilité a posteriori pour que h soil 
compris entre certaines limites. 

Cette probabilité est 

PiTBi 

PiTiïi 


rsi eslJa probabilité a priori de la cause, c’est-à-dire pour 
que h soit compris entre h et k-^-dh; p ( est la probabilité 
pour que, si la cause a agi, les observations aient donné des 
résultats respectivement compris entre et 

0 &. 1 d^r 2 , ..., et Xji [ dxn . 

Cherchons la valeur probable d’une fonction de h , f(h); 
cette valeur probable est 


Ah) 


'ZfWpçTSj 

2 PiTSi 


Faisons de suite la remarque que le résultat va dépendre 
de la probabilité a priori; le résultat de Gauss ne peut donc 
déjà être tout à fait exact. 

Si je détermine h par 


Ah) =Ah), 
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cette valeur probable de h dépendra de la fonction /. 

Si je cherche la valeur la plus probable, ce sera la même 
chose. 

On peut se tirer d’affaire à une condition : c’est que le 
nombre n soit très grand. Le factedr tsi n’a plus grande 
influence; ainsi, pour 

f{h)=h\ 

toutes les méthodes conduisent au même résultat, si toute¬ 
fois le nombre des observations est très grand. 

199. Lorsqu’on observe une quantité s, et que les obser¬ 
vations ont donné x lt ..., x n , on peut représenter et 
Pi par 

nr,-= <{>(/», z) dh ds, 
pt= H dx, dx^ ... dx n . 

La probabilité a posteriori pour que h soit compris entre 
h et h -l- dh, et s entre z et z-h ds, est 

z)dhds dx, dæ „... dx n 
J' IT^(A, z) dh dz dx, dæ t ... dx n 

Les différentielles dx u dx.,,dx n disparaissent dans ce 
rapport, et il faut intégrer par rapport à h de o à -i- 00 et par 
rapport à z de— 00 à - 1 - 00 . 

Imaginons que, au lieu d’une quantité z, il y en ait n , 
z t , z 2 , ...,z n , qui dépendent de p variables u 1} a 2 , .... u p , 
et que les valeurs observées des z soient x u x % , x„; les 

erreurs commises sont y 1} y 2 , ..., 

iSi sera la probabilité a priori de la cause : ici, pour que 
h soit compris entre h et h 4 - dh, et pour que soit com- 
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pris entre u t et u^du^, « 2 entre «„ et u 2 -{-du 2 , 

« 1 , u 2 , _ , u p ) dh du i du 2 — du p . 


Pt sera la probabilité de l'effet en supposant que la cause 
ait agi 

Pi— Il dx l dx t ... dx n , 


où 


n= 



e-h^y\ 


La probabilité a posteriori sera 

Il ty{h, «j, « 2 j • • • > u p) dh du\ du 2 ... du p dx t dx 2 ... dx n 


J II ijj( /*, u u u 2 , ..., Up) dh dui du 2 ... du p dx t dx 2 ... dx n 


Il faut intégrer par rapport à h de o à -t- 00 , et par rapport 
aux « de —00 à -+-00 ; quant aux différentielles des x, elles 
disparaissent comme précédemment. 

La'probabilité cherchée s’écrit donc 


II<J> dh du t du t _ du p 



dh du l du, du p 


200. Elle dépend de la fonction ^ qui est entièrement 
arbitraire, et qui est soumise à l’idée que nous nous faisons 
a priori de la valeur des u et de l’exactitude que nous attri¬ 
buons a priori aux observations; mais ip ne joue pas le plus 
grand rôle si les observations sont nombreuses. 

Je vais appliquer à celle fonction i|/ une forme particu¬ 
lière, en supposant qu’elle ne dépend pas de h. 

On justifie celle manière de voir en disant que les mesures 
donneront en général aux u des valeurs très voisines les 
unes des autres ; qu’elles sont comprises dans un petit inter- 
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valle où la valeur de s variera peu si les observations sont 
concordantes. 

La valeur probable de fi? sera 


I II tj; ti‘ dhdu l da i du p 

Tv_ 

J "Ety dh du t dus du p 


IC 1 — 


Ces deux intégrales doivent être calculées de la même 
manière : h y varie deoà-l-oo et les a de — <x> à-t-oo. 


201. Qu’est-ce que 2/ s ? C’est une fonction de as t qui est 
connu, et de s t qui est une fonction des «. 

Par la méthode des moindres carrés, on obtient comme 
valeur à adopter pour u t la valeur u\ : les valeurs des u 
ainsi définies ne sont pas exactes, mais elles sont les plus 
convenables à adopter, 

lli= w? -f- <’i, 

v t étant très petit. 

Les jj-sont des fonctions des v,-, et on peut les considérer 
comme des fonctions linéaires des v it en négligeant les 
carrés. 

Le polynôme 

2y '-=P 

sera du second degré par rapport aux v,-, mais non homo¬ 
gène; il atteint son minimum quand les «’,• sont nuis. 

Les équations 

dP 

-T- =0 
dvi 

doivent être satisfaites quand les sont nuis. 
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Donc P ne renferme que des termes du second degré et 
du degré zéro ; il n’y a pas de termes du premier degré. 


P = P 0 -f-P 2 . 


P„ est le minimum de ce qu’on a appelé 2y'*, dont 
la valeur probable est (n — p) m?. Donc P 0 est très grand en 
général, et il y a d’autant plus de chances qu’il soit grand, 
qu’il y a plus d’observations. 

Po= («—/>) A, 


A étant une constante. 

Le polynôme P 2 est obtenu en additionnant entre eux les 
termes du second degré ; il y a un très grand nombre de 
carrés, il y en a n, et les coefficients du polynôme P 2 sont 
du même ordre de grandeur que n. 


Pî=(«— p)Q, 


Q étant de l’ordre de grandeur de A. 
La valeur probable de If sera 


ÇIf e~ /'(n— PH A-f-Q) dh dç t _ dv p 




e -A(re-p)(A+Q) d/l do j dv 2 . . . dv p 


on intègre par rapport à h de o à -t-oo, et par rapport aux 
v de — oo à -+- oo. 


202. La première intégrale porte sur 


g— /i(rc—p)A 
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qui dépend de h et sur 


pi Q 

qui dépend des v. 

Il faut calculer haut et bas 


j" e —IHn—p)<i dilj d(> 2 . . . dv p 


Q est un polynôme homogène et du second degré par rap¬ 
port aux v ; je pose 

M t= Vi sfh. 

AQ devient un polynôme Q'homogène et du second degré 
par rapport aux &>. 

L’intégrale devient 

I g—O dcù i dm ... d(ù p h 2 . 

Les limites de l’intégrale restent les mêmes, et la valeur 
de l’intégrale est 

_ p 

B A 2 , 

où B ne dépend pas de A. 

Alors 

/ » _n n—p 

dhtytùTt: 2 A 2 e — p'B 
n- = — - - 

f oo n n—p 

dh 'Jj7î 2 A 2 e ~ kAln -~ p) B 

— il 


X " Tl—p 

'bld h 2 g-* A (n— p) dh 


J /»“ n-i 

r », 


e -A A(n-p) gjT/j 
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Je pose 


$ = \fhe~ ,L ^, 

Ç i{/ A v dh 

K?=à -, 


Ç ij/O" 

Jo 


-Pdh 


formule qui dépend de <J>. 


203. Si nous voulions pousser plus loin, il faudrait intro¬ 
duire une hypothèse sur i{/. Cependant, quand on suppose 
n — p très grand, la fonction i{/ n’a plus d'influence. 
Lorsqu’on a 


J'FQpdk 

J F 4 dh 


et qu’on fait croître n indéfiniment, la limite de ce rapport 
est 


F (ko) 

F, (A.)’ 


où A 0 est la valeur qui rend O maximum. 
On a donc ici 


c’est-à-dire 


h? — 


<KA 0 )/l v 

,<k(Ao) ’ 


/i v = h? 0 . 


h 0 étant la valeur qui rend $ maximum. 

A cette condition de n très grand, la valeur probable de 
h v ne dépend plus de t{/; la valeur probable de h est tou¬ 
jours h 0 , quel que soit v. 



278 


CHAPITRE XIV. 


II n’en serait pas de même si l’on ne supposait pas n très 
grand. 

De plus, n doit être très grand, non seulement en valeur 
absolue, mais par rapport à p d’une part et à v d’autre 
part. 

Ainsi, si 

n — p 

v=-- -, 

2 

t 

il faudrait rendre maximum non plus <&, mais 
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et par suite 

h - n ~ p • 

0— 22 / 5 ’ 

c’est bien la même valeur. 

Il ne faudrait pas attacher grande importance à ce qu’on a 
raisonné sur n — p au lieu de n, parce que n est très grand 
n — p 

et que -est voisin de i. 

^ n 

La règle est donc justifiée si le nombre des observations 
est très grand.. 
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THÉORIE DE L’INTERPOLATION. 


205. Je vais appliquer la méthode des moindres carrés à 
une question nouvelle, la recherche d'une fonction incon¬ 
nue f^æ). 

Nous mesurons certaines valeurs de celte fonction. 

/(« 1 ) =A„ 

/(a,) ~A,, 


-A; * 

Construisons la courbe 

dont on a ainsi un certain nombre de points. 

On pourrait toujours, par ces points M„ M 2 , M„, faire 

passer une courbe, mais celte solutionne serait pas la meil¬ 
leure : on fait passer une courbe près de ces points, aussi 
continue que possible. 

ün autre procédé présente aussi un certain degré d’arbi¬ 
traire comme le procédé géométrique: je veux que ma 
courbe soit de degré q aussi petit que possible, 


f(&) -Co -H Ci CG -t~. • - “H C qCC'l J 
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q est plus petit que n —i;car si q était égal à n — 1 , on 
aurait une fonction satisfaisant exactement aux conditions. 

Quelle valeur attribuer à qï Celte valeur est arbitraire. 
On la choisit d’abord assez petite, puis, si elle est insuffi¬ 
sante, on introduit un terme de plus dans le second membre, 
et ainsi de suite. 

206. Laissons de côté ce mode de tâtonnements et sup¬ 
posons q choisi. 

Nous déterminerons les coefficients du polynôme de telle 
façon que 

As¬ 
soit minimum. 

f(æ) est linéaire parrapport aux coefficients C. 

Je vais poser 

F(«) = —a t ) (as — a % )...(æ — a n ). 

La question se rattache au développement en fraction con¬ 
tinue durapport 

F(£) 

F(«) 

Ce développement s’opère comme si l’on cherchait le plus 
grand commun diviseur de F et de F f . On aura successive¬ 
ment 

F = QiF'-f- R u 
F'= Q 2 Ri -t- R21 
Rl— QsRa-t- R 31 


R»— 3 — Q«--i R/i —2 -t - Rr— i, 

Rn- 2 *— QrRh— 1 * 

II n’y a pas de terme R» dans la dernière équation, car 
R„ = o. 
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En général. F est de degré n, F' de degré n — i, Ri de 
degré n — 2 , R p de degré n—p — 1 , R B _ t de degré o et tous 
les Q de degré 1 . 

On a 

F' r 


Ri 

F' 


1 


Q*+ TT 


Ri 

R. 


9 


Ainsi 


Rn-2 
Rn—3 


I 


Q»—1 


R„-i 

Rn—2 


> 


Rn—1 J 
Rn —2 Qn 


F 

F 


1 


Q> + 


Qï-h 


Qa 


'. 4 - 


Qn—i + 


Qn 


207. Nous avons à considérer les réduites successives de 
ce développement. Gomme 

F — Q t F' = R t , 

à la place de 

F'-QiRi^Ri, 

je puis écrire 

-Q.F + F'(n-Q 1 Q,)=R*. 

Si je pose 

Ni = i, Di=Qi, 
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j’aurai 

NiF —DjF'^Rt. 

Si je pose 

Nj=—Qs, Ds=—(i + QiQ 2 ) 

j’aurai 

NjF —D 2 F'=:R 2 . 

Nous exprimerons de la même manière un quelconque 
des restes successifs, 

NjF—D t F=R,, 

N m F —D m F'=R m . 

Comme 

Ri— Q/«R*m *^* Hi +21 

Ri+s=(N,F - D,-F') - Q m (N m F - D /+1 F), 
si je pose 

N;4- 2 — N, Qi-f-2 N 

DfH = D;— QtwDi+ii 

j’aurai encore 

R f+2 =N i+2 F-D^ 2 F. 

Sur ces relations de récurrence, on constate que 
Ri, R 21 • • - fil R «—2 

sont respectivement de degré n — 2 , n — 3, ... et r, et 
que R„_i est une constante. N t est de degré 0 , N 2 de degré 
r, ..., N* de degré i — 1 . On voit aisément que, si cette pro¬ 
position est vraie pour N, et N,- +1 , elle l’est encore pour N £+2 . 
D, est de degré i. 

208. Je dis maintenant que N* et D ; sont le numérateur et 
le dénominateur de la réduite d’ordre i. 
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Les relations de récurrence rendent ceci évident; mais 
on peut le voir autrement. 

J’écris la suite 

F = QïF'-i- Ri, 


Ri -2 — Qf i -t- Rî> 

d’où je déduis 

F 
F 

Je puis encore écrire l’équation suivante 
N t -F —D*F'=R f . 

Supposons que l’on veuilLe calculer la réduite 


i 





Ur 


Je n’ai qu’à faire R t - = o dans l’égalité précédente, et faire 
aussi 

f — pi, f 

Ri j 

«*=Q.R', + Ri, 


les R étant devenus des R'. 
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On a entre les R' également des relations de récurrence. 


R ' 1 = Q 3 R'-i-R' ) 

. y 

Rî_ = Q/R*-i; 

Rj est nul; donc, N/ et D £ étant les mêmes que plus haut, 
N £ [3 £ * R î&î :== o, 

«Î_N£ 

Pr“Dr’ 

N- 

YP est bien la i ,ème réduite. 

l)i 

Quelle relation y a-t-il entre cette réduite et le problème 
proposé? 


209. L’équation fondamentale est 

N*F —D,-F'=R,-. 

Faisons attention au degré de tous ces polynômes. Rappe¬ 
lons que : N £ est de degré i —i; F est de degré «; D; est de 
degré i; F' est de degré n — i; R £ est de degré n — i — i. 
De l’équation fondamentale je tire: 

F ^ F 


Je multiplie les deux membres para^, 


^D/F' 

F 


- Nj-æ! 1 — 


a* Ri 

F 


Je m’en vais évaluer la somme des résidus dans les deux 
membres; notons d’abord que pour ce calcul nous ne devons 
tenir compte que des deux fractions où F entre au dénomi¬ 


nateur. 
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Supposons ensuile que, dans une fraction rationnelle, le 
degré du numérateur soit d’une unité inférieur à celui du 
dénominateur, par exemple 

x n-l B "^*— 2 -+-. . . _ 

A'Je' 1 -t- B' x a ~ l -i-... ’ 


celte fraction se décomposera en 


2 


A 


x — a 


Si je multiplie par æ. 



B 

{æ — a) îi 


2 


Ax 
æ — a 


tendra vers 2A, ou la somme des résidus, quand x croîtra 
indéfiniment, les autres 2 (c’est-à-dire celles où æ- — a entre 
au dénominateur à une puissance plus grande que i) s’annu¬ 
leront. 

Mais 

«27 P 

lim-Q- — o, pour x—ca, 

si le degré de xP est plus petit que celui de Q. Donc: 
la somme des résidus sera nulle si le degré du numérateur 
est inférieur de plus d’une unité à celui du dénominateur. 
Considérons 

F ’ 


le dénominateur est de degré n, le numérateur de degré 
n — i — i -+- fi. Si 

n — i — î-4-(a-</i — i, 

c’est-à-dire 

la somme des résidus sera nulle. 
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Ainsi, quand p. est égal, à 0 , 1 ,i — r, la somme des résidus 
est nulle. 


P 

210. Quand on a affaire à la fraction rationnelle que 

Q n’a pas de racines multiples et s’annule pour æ = a, le 
résidu pour x = a est 


P (a) 

Q'(«r 


Prenons pour a l’une des valeurs qui nous a servi à cal¬ 
culer/ (æ) ; le résidu par rapport à a de 


F 


sera 

aP-Di(a) F'(a) 

F'(a) ’ 

ou 

aV'T)i(a). 

Ainsi,.pourvu que p. soit plus petit que i, 

2aV- D ((a) — O. 

la sommation étant étendue à toutes les valeurs de a, 

1 

Il en résulte que, si P,_! est un polynôme quelconque 
d’ordre i— i, 

Prenons 

Pi-i= 


alors 

2D*-(a) D f (a) =o. 


Cette équation est vraie pourvu que k soit plus petit que i. 
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Mais, comme rien ne distingue les deux indices, cette 
équation est encore vraie toutes les fois que k est différent 
de i. 

Les polynômes de Legendre ont une propriété analogue; 
pour deux d’entre eux 



ici, au lieu d’intégrales, on considère des sommes finies. 

211. Nous voulons obtenir un polynôme d’ordre q plus 
petit que n — i, dont les coefficients seront choisis de telle 
sorte que 

2 [A -/(«<-)? 

soit minimum. 

Si f(æ) est un polynôme d’ordre q, il peut toujours être 
mis sous la forme 

= — C 0 -t- Ci Di(æ:) -+- Cj 1)2(3;) -t-..C ? D (j r( 3 ;). 


Il s’agit de déterminer les coefficients C de façon à rendre 
minimum la somme des carrés 

2(A— C„— Ci D,— C 2 D,—...—C y D y ) 2 . 

212. Développons ce carré. 

Sur une première ligne, nous mettrons les termes carrés 

2A 2 -t- »CJ -t- Cf 2D? + Cl 2D* +...+ C*2D*. 

Sur une seconde ligne, nous mettrons la somme des 
termes rectangles tels que 

— 2 C„2A — 2 C t 2 AD, —... — 2 C»2AD 7 , 
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OÙ 

.SADgr— AiD g (aj) -t-..A„D ? ( æ„). 

Sur une troisième ligne nous mettrons une somme de 
termes tels que 

aCoCt2D,+ 2 CjCfciDj-D*. 

Or 

2D*(a)=o, 

SD,D a .=o. 

Restent la première et la deuxième lignes. Je puis d’ail¬ 
leurs abréger l’écriture en posant 

i = D 0 (aQ. 

J^a somme des termes à rendre minimum se réduit à 

2A 2 -t- 2C?2D? — 22C,-2AD,-. 

Je différenlie par rapport à C t - et je divise par 2 ; en éga¬ 
lant à zéro la dérivée par rapport à G,-, 

(i2DÎ = 2AD/, 

d’où l’expression suivante pour C,-, 

r _ 2 AD, 

2D? ’ 

c’est-à-dire 

n AiDf(a t ) -t- A»D,-(«») -t-. • .-t- A»Df( <t n .) 

l ~ D|(a 1 )-t-D?(« 2 )-t-... + DH« B ) 

L’analogie avec un autre problème d’analyse est - évi¬ 
dente. 

Quand on veut développer une fonction / (æ) en série 
procédant suivant les polynômes de Legendre, on arrive à 


p. 


f(æ) = SCfXft 


20 



29 ° 

où 
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Ici les relations sont du même genre, sauf que, au lieu 
d’intégrales, figurent des sommes. 

213. Quel est l’avantage de ces polynômes D ? 

Je suppose que l’on ait essayé d’abord de représenter les 
observations par un polynôme de degré q : on a trouvé 
alors C 0 , Q,..., C 7 . On constate ensuite que la somme des 
carrés des erreurs commises est inadmissible : on se résigne 
alors à poursuivre avec un polynôme de degré q- 1- 1 . Tout 
serait à recommencer, si l’on avait eu recours à un procédé 
quelconque; ici, au contraire, on n’a qu’à ajouter un terme 
C 7+1 D 7+1 (æ) : les précédents coefficients C 0 , C t , ..., C 7 , ne 
changent pas, comme on le voit sur l’expression de Ci. 


214. Le problème se pose déjà quand on veut simplement 
interpoler une fonction : pourquoi prend-on habituellement 
comme solution un polynôme d’ordre n — i ? 

Voici une fonction /( æ), holomorphe à l’intérieur d’un 
certain contour, d’un cercle par exemple. Les valeurs que 
nous avons données à la variable sont petites par rapport au 
.rayon du cercle. 

Pour les valeurs a u a 2 , a a de la variable, on connaît 
la valeur de la fonction. Il s’agit de connaître la valeur de 
la fonction pour une valeur æ à l’intérieur du cercle. 

L’intégrale 


/ 


, _ /(*) dz _ 

(•= — æ ) ( s — «0 (- — a i)-• -G 5 — «») 
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s’annule prise le long du cercle. D’aulre part, 

J= _L f _ /(g) dz _ 

J (s — X) (s — a t ) (z —« 2 )...(s — a n ) 

est la somme des résidus de la fonction/(s) pour les pôles 
æ, a x , _, a a , c’est-à-dire 


(.» — a x )(æ—at)...(x—a n ) ' (a t — æ) (a,— a 2 )...(a t —a a ) 

J’appelle en général P t le polynôme qu’on obtient en sup¬ 
primant dans 

(s — — «îK- 5 — «»)_(g — «») 

le facteur s— a £ -, et en remplaçant - par a £ -. Je pose aussi 
F(æ)=: (æ — a x ) (æ; — at). ..(æ — a«). 


r_/( a 0 , /(«iV , /(«î) , , /(«») 

J “TT “PT " TT’ 

~/(^)=-2 /(g p F(a?) - { - jF (^)- 


215. Telle est la formule générale de l’interpolation; au. 
second membre figurent: i° un polynôme entier; 2 0 l’erreur 
commise. 

Cette erreur est 

Tr , ' 1 f f(æ) dz æ — «i æ — a 2 æ — a n 
JJ? — -T- I *-- • • • -’• 

2 TT J “* 5/ « ■ • 4» ■ 1 Cio Z ~~ Ci 

Si R désigne le rayon de convergence, et que æ soit assez 
voisin de a x pour que 

1 i^- R 

\æ — ai < — > 

2 
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chacun des facteurs ^—— sera plus petit que -, et sous le 

•»> Ct>i 2 

signe J il y a « de ces facteurs. 

D.onc JF sera très petit si n est très grand. 

S’il était seulement probable que le rayon de conver¬ 
gence ait une certaine valeur, on serait en présence d’une 
question de probabilité. 

216. Je suppose que l’on sache a priori que la fonction f{æ) 
est développable, dans un certain domaine, suivant les 
puissances croissantes de æ, 

f(æ)=k<> + - 

Nous ne savons rien sur les A, sauf que la probabilité 
pour que l’un d’eux. A,-, soit compris entre certaines limites, 
y et/-+-rfy, est 



Nous connaissons par n observations 

/(«1) =B t . 

f{a 2 ) =B,. 


f( a n) =B„. 

Nous cherchons la valeur probable de f \æ) pour une 
autre valeur de æ. 

C’est un calcul d’interpolation, avec cette différence que 
nous cherchons un polynôme- limite. 

Je me hâte d’ajouter que je considère la question comme 
un simple exercice de calcul, car j’ai introduit arbitrai - 
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rement la loi de Gauss; autrement le problème resterait 
indéterminé. 

217. Nous avons à déterminer les coefficients A, en nombre 
infini, de la fonction, à l’aide de n observations : ici, il y a 
plus d’inconnues que d’observations, et nous ne pouvons 
nous guider que par l’idée que nous nous faisons a priori 
de la loi de probabilité. 

Nous nous élevons ainsi en généralité plus encore que 
nous ne l’avons jamais fait jusqu’ici, puisque nous avons à 
déterminer une fonction inconnue. 

Je vais d’abord ne prendre qu’un nombre fini de coeffi¬ 
cients. 

218. D’une manière générale, soit un nombre fini d’incon¬ 
nues, 

ui, « î , ..., u p ; 

p est connu. 

Je suppose que la probabilité, pour que u t soit compris 
entre aet« + du, est représentée par la loi de Gauss, 

^fhL e ~ h ‘ ui du. 

La probabilité pour que l’un des u s’écarte de zéro sera 
d’autant plus petite que h sera plus grand. 

Nous connaissons les valeurs de certaines fonctions 
des u, 

î 1 ^2j • • •? Z'ni 

en supposant les observations parfaitement exactes. 

n est plus petit que p, il y a plus d’inconnues que d’ob¬ 
servations. 

Je suppose que les æ sont fonctions linéaires des u; c’est 
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ainsi que, dans l’exemple qui précède, les B étaient 
fonctions linéaires des A et qu’on avait 

B/.= Ao-i- Ai a k -\r .... 

Je pose donc 

yk— ci «i -+- c| cg «p.. 

Les observations nous ont appris que j* est compris entre 
x k et x k -f- dx k . Chercher les u, c’est résoudre un problème 
de probabilité de causes.. Les causes, c’est que les w sont 
compris entre certaines limites ; les effets observés, c’est 
que les x sont compris dans certaines limites. 

La formule 

Pt^t 

Sp&i 

va se simplifier ici. ‘ 

219. Si les u ont des valeurs déterminées, les fonctions 
linéaires œ k auront également des valeurs détèrminées, et 
la probabilité de ces valeurs sera la certitude ; suivant que 
ces fonctions tomberont ou non entre les limites données 
par l’observation, la 'probabilité sera i ou o. Donc la for¬ 
mule de la probabilité a posteriori se simplifie en 

TS(\ 

v—» 

luxe 

si l’on a représenté par p t la probabilité de l’effet quand la 
cause agit. 

liosi porte sur toutes les probabilités relatives aux valeurs 
des u compatibles avec les observations; 7s c - est la probabi¬ 
lité a priori pour que les diverses quantités « soient com¬ 
prises entre certaines limites. 

La &î ème , inconnue h poür probabilité d’être comprise entre 
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u/c et U/ c 4 - du/c, 


— e- h v‘l dk ; 

7T 


ntt comporte p facteurs analogues, 

vst = ‘ e ~ l* 1 u \*- k *- u \+~-*- h t»p du t du*... du p ', 

j’écrirai pour abréger 

TïT /— H du L du 2 •.. du p . 


d’où 


'j'TLdu l du *... du p . 


Il faut intégrer pour toutes les valeurs des u compatibles 
avec les observations, c’est-à-dire satisfaisant aux inéga¬ 
lités 


3?/ t <C Cjfc Ki 4- G| u* 4~... 4 - C% k p < &ji 4- dx/ L . 


La probabilité cherchée sera 

5 st n du t du 5 ... du p 

~‘ 7SJl J' II duy du *... du p 

quand les u satisferont aux inégalités ci-dessus. Sinon'l’on 
aura 0 comme probabilité. 


220. Si je cherche la valeur probable d’une fonction quel¬ 
conque F des u, 

I FILdUi duz ... du p 
F = -1 --- 
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Nous allons transformer ces deux intégrales. 

On a 

h ^ y U ^ ’^’/i dxj t . 

Je vais prendre pour inconnues y 2 , y,„ et j’y 

adjoindrai p — n fonctions linéaires des u tout à fait quel- 
C0ll(|U.6Sj iSoj • • • y Ajp_ ji• 

Il du t du« _ du p 

va se transformer en 

IIA d\\ dy %.. .dy a dz x dz*...dz p_ n . 

A est le déterminant fonctionnel des u par rapport aux y 
et aux z; comme ce sont des fonctions linéaires, A est 
constant. Il vient 


I Fil dy t dy „... dy n dz t dz ,... dz p - n 
* =—r - 

/11 dy 1 dy 2 ... dyp dix j ... dz p p 


Nous avons à intégrer d’abord par rapport aux y; y\ par 
exemple variera depuis x x jusqu’à æ x - 1 - dx x , c’est-à-dire 

très peu; la fonction sous le signe j'va rester sensiblement 
constante, et l’on pourra écrire 


dæ x dx î .. .doOp I Fil dz t dz 2 ... dz r _, t 

F = - •! - 

dx x doc n ■,. dx p i 1 dix j dix*... dix p _ p 


Les différentielles des x disparaîtront. 

Fil èt II sont des fonctions des z, et nous intégrerons 
par rapport aux z de — » à +- ». 

Il est le produit d’un facteur constant par une exponen- 
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lielle, e ( /, i“ï +A *“’- 1 -—+V'?); l’exposant est un polynôme—P 
du second ordre et non homogène par rapport aux z. 


221. Supposons F fonction linéaire des z. Cherchons la 
valeur probable de F. 

Les valeurs probables des différentes quantités z s’ob¬ 
tiennent en cherchant les valeurs qui rendent minimum 
l’exposant P : soit z ? la valeur de z £ qui rend P minimum. 

Alors 

P — Pj-f"Po* 


P 0 est une constante, et P 2 est un polynôme homogène 
et du second degré par rapport aux quantités z £ — z% 
L’intégrale 



î» ) e~ v dz £ dz » 


dz 


porte snr nne fonction impaire par rapport à z l — z° i ; en 
intégrant de—oçà-t-», on aura zéro pour la valeur de 
cette intégrale. 

On en déduit qne, si F est égale à F 0 quand on y remplace 
- £ par-?, 



— F 0 ) er~ v dzi dzî ... dz p ~ n 


est nulle, prise de —» à -i-co. 
De même 


jj [1 — F0 ) Il dz , dz ». . . ds p - n — O £ 


et par suite 


*j‘ FII^! dz». .. dz p _ n —F„ j*TLdzi dz ï .. .dz p — n 
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c’est-à-dire 
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F = F 0 . 

. Ainsi on obtiendra la valeur probable de F en substituant 
à St les valeurs qui rendent minimum le polynôme P. 

222. Appliquons ces principes au problème posé au para¬ 
graphe 216. 

Au sujet de /(æ), nos inconnues u sont les A et nous 
avons 

P = /i„Aü -î-A.Aï -K - .-t-Zi.-A? -t-..,. 

Il faut rendre ce polynôme minimum. 

Les valeurs des A seront d’ailleurs arbitraires, sauf les 
relations linéaires données par les observations 

f( a h) =B/i- 

Écrivons que P est minimum. L’accroissement dJP devra 
être nul quand les A f s’accroîtront de dk t 

dP — Aq dA 0 -i— ... 4 - hikt dA i -|—... o. 

Les accroissements dA 0 , .. ., dAg, ... sont liés par 
d/(a i .)=o. 

Or, /(ai) par exemple est égal à' 

/(a 1 ) — A„ -t- Ai a, -1-... -t- A^a, 4-.. • • 

Donc 

dAo ~i— a l dAi —E—... -l— a, dA,-i—... — o, 
dAo 4" a 2 dAi 4-... 4— ^2 dA, 4 —... — 0 , 


dAo 4— a K dA t 4-... 4- ajj dA^-i—•. • — e* 
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223. Pour que P soit minimum, la première équation 


<fP =r o 


doit être satisfaite quels que soient les dA ; cette première 
équation doit être une conséquence des n autres relations 
entre dA. 

Soient s t , s,, ..., z n des coefficients convenablement 
choisis, par lesquels nous multiplions respectivement les 
deux membres de chacune de ces n relations, 


h t Ai—z x a\ -t- e . 2 a\ -t-... -t- s, t a\, 

K x t- e . £o , . . (*«»)* . 

A ‘* 1 ht ht + * ht 


Si je pose 


, . 1 æ 

O (a?) - y— -f- y- — -{“ . . . ' 

Aq «2 




le coefficient de £i dans 

f(æ)=1Atæ t 

sera a (a?®,), etc. 

Il vient donc finalement 


f{æ) — z l o(æa,) -t-£ 2 cp(a;a 2 )4-.. .+ £,»(««,). 


Nous disposerons des coefficients s de façon à satisfaire 
aux observations, d’où, n équations à n inconnues. 

224. La forme de /(#) dépend des h. Pour que la série 
qui représente <j> (a?) soit convergente, il faut que les coef¬ 
ficients h augmentent avec une rapidité suffisante. 

Si l’on a 

M <p et | «a | < p, 
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c’est-à-dire 

1 æa h | < p 2 , 

la série sera convergente quand 

ht> p-'. 

En somme, cela revient à dire que la probabilité pour que 
les derniers coefficients en A t - s’écartent de zéro devient de 
plus en plus faible. Il suffit de supposer qu’à partir du « iêm<! 
rang les h sont infinis. Dans o (a;), les termes extrêmes où 
entrent h n , h n+l ... s’annuleront et o{æ) sera un polynôme 
d’ordre n. 
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225. Battage des cartes. — Je me suis occupé dans l’in- 
■troduction des problèmes relatifs au joueur qui bat un jeu 
de cartes. Pourquoi, guaud le jeu a été battu assez longtemps, 
admettons-nous que toutes les permutations des cartes, c’est- 
à-dire tous les ordres dans lesquels ces cartes peuvent être 
rangées, doivent être également probables? C’est ce que 
nous allons examiner de plus près. 

Soit q le nombre des cartes; soit S £ une permutation 
quelconque, c’est-à-dire l’opération qui consiste à faire 
passer au rang a la carte qui avant la permutation occupait 
le rang (3; a étant une fonction déterminée de (3. Le nombre 
total des permutations possibles est q \ Il y aura un certain 
ordre des cartes que nous considérerons comme normal, 
et que nous désignerons par S 0 ; et nous représenterons par 
S,- l’ordre dans lequel se trouveront rangées les cartes, 
lorsque, primitivement rangées dans l’ordre normal, elles 
subiront la permutation S £ . Ainsi S 0 représentera à la fois 
l’ordre normal, et la permutation identique, celle qui n’altère 
pas l’ordre des cartes. Cela posé, deux permutations consé¬ 
cutives S £ - et S y équivaudront à une permutation unique S*, 
et c’est ce que j’exprimerai par la relation 

(i) S,Sy=S*. 
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Un ensemble de permutations forme un groupe quand le 
produit de deux permutations quelconques de l’ensemble 
appartient à l’ensemble. 

Soient donc 

So, Si, •••, s r 

les diverses permutations d’un groupe G et les ordres corres¬ 
pondants des cartes. Supposons que nous sachions que 
l’ordre du jeu appartient à ce groupe, et que les diverses 
permntations du groupe aient pour probabilités respectives 


P»y- Pii •••! Pr> 

de telle sorte que 


Po ~+~Pl -+■ • • • -+* Pr — 1 • 

Nous pouvons représenter symboliquement cette loi de 
probabilité par un nombre complexe. On sait que l’on a 
inauguré des nombres complexes de la forme 

X = æ 0 e 0 -f- x l e l -h. ..+ x r e r , 

où les æ sont des quantités ordinaires et les e des unités 
complexes. Les opérations sur ces nombres complexes se 
font d’après les règles ordinaires du calcul, avec cette dif¬ 
férence que la multiplication, qui reste distributive et asso¬ 
ciative, peut ne pas être commutative. On définit un système 
de nombres complexes, en se donnant la règle de multipli¬ 
cation, c’est-à-dire en définissant le produit e*ey de deux 
unités complexes quelconques. 

Nous allons définir un système de nombres complexes 
correspondant à notre groupe G; à chacune des permutations 
Sj de ce groupe, nous ferons correspondre une unité 
complexee £ -; et si l’on a l’équation (r) S £ Sy = S*, nous con- 
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viendrons que le produit e t e } est égal à e k . Cette règle est 
admissible, puisqu’elle est associative. 

Nous pourrons alors représenter symboliquement la loi 
de probabilité envisagée par le nombre complexe 

V=.p n et-* r p i .e l + . ,.-hp r e r . 


226. Le joueur qui bat les cartes a des habitudes, de sorte 
qu’à chaque coup, il y a une probabilité p ( pour qu’il fasse 
subir aux cartes la permutation S,-. Celte loi de probabilité, 
qui nous est d’ailleurs inconnue, est représentée symboli¬ 
quement par le nombre P = 2/> £ e £ . Si l’on est parti de 
l’ordre normal, la probabilité pour qu’après un conp on ait 
l’ordre S,- sera de sorte que la loi de probabilité des dif¬ 
férents ordres sera encore représentée symboliquement par 
P. Si au lieu de partir de l’ordre normal S 0 nous étions 
partis d’un ordre quelconque S y -, la loi de probabilité aurait 
été représentée par e y P. Si avant le coup la loi de probabi¬ 
lité était représentée par le nombre complexe Q, elle le 
sera après le coup par QP. Si donc nous partons de l’ordre 
normal et que nous battions n conps, la loi de probabilité 
sera représentée finalement par le nombre complexe P' 1 . 

Ce que nous voulons démontrer c’est que, si n est très 
grand, on aura sensiblement 

P re = - (e 0 —t— e l + . e,.), 

c’est-à-dire que tous les ordres possibles seront également 
probables. Et ce résultat sera indépendant de P, c’est-à-dire 
de la loi inconnue de probabilité, des habitudes inconnues 
du joueur. 


227. M. Cartan a introduit dans la théorie des nombres 
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complexes la notion de l’équation caractéristique. Soient A 
un nombre complexe donné, Xun nombre-complexe inconnu, 
g) un nombre ordinaire inconnu; considérons l’équation 

( 2 ) AX = ta X. 

Les deux membres sont des nombres complexes, et en 
égalant les coefficients de e„, e u ..., e r , on aura /•+1 équations 
entre les /■ +-1 coefficients æ { du nombre complexe inconnu 
X; ces équations sont linéaires d’une part par rapport aux æ { , 
et d’autre part par rapport à u et aux /• - 4-1 coefficients a t 
du nombre A. Nous avons donc r + i équations linéaires 
par rapport aux r-t-i inconnues æ t . Écrivons que le déter¬ 
minant A de ces équations est nul; nous aurons une équa¬ 
tion algébrique d’ordre /• + 1 qui déterminera w. D’après le 
théorème des substitutions linéaires, à chaque racine simple 
de cette équation A = 0 , correspondra uu nombre complexe 
X satisfaisant à ( 2 ). A une racine double correspondront 
deux nombres complexes X et X t , tels que 

(2 bis) AX=wX, AX 1 =g)X 1 4-£,X. 

A une racine triple, trois nombres X, X 1; X 2 , tels que 

(2 ter) AX—wXj AXi=^G)Xj-4-£iX, A X 2 ^ 51 X 2 - 1 -£ 2 X 1 , 

et ainsi de suite; les £ sont des nombres constants ordinaires 
qu’on peut supposer égaux à o ou à 1 . Remarquons que, si 
£i = £ 2 —o, on aura 


A( XX -+- XiX[ - 4 - À 2 X 2 ) = u (XX -4- À, Xi -4- X 2 X 2 ) 

quelles que soient les constantes 1, 1, (qui sont, bien 

entendu, des nombres ordinaires). 

Dans le cas des nombres complexes dérivés des groupes. 
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il y a quelques simplifications. Soit X un nombre complexe 
quelconque et posons 

X = Y = 2, y y ej ; 

on voit tout de suite que les/ ne sont autre chose que les* 
rangés dans un ordre différent. Il en est de même si l’on 
pose Xe/■ = Y; on a d’ailleurs 

e„X = Xe 0 =X, 

de sorte que l’équation ( 2 ) peut s’écrire 
(A — (ae„)X=:o. 


228. Je forme l’équation caractéristique du nombre P 
PX = aX 


et je me propose de montrer d’abord qn’elle a une racine 
égale à 1 , et toutes les autres plus petites que 1 en valeur 
absolue. 

Soit en effet 

P X = 2y t e t ; 


on aura 


ji=2p/,x ây 


les indices i, k et h étant liés par la relation e k e !L — e h de 
sorte que, si j’écris 

yi=^Pà.t^u, 


les pru ne seront autre chose que les pi L dans un autre 
ordre. L’équation ( 2 ) nous donnera alors 

(3) ~‘Ph,£3'Ii — 61*/. 

Nous pourrons satisfaire à ces équations (3) en prenant 


P. 


21 



3o6 


CHAPITRE XVI. 


tous les xt égaux entre eux, d’où nous déduirons 
2j3*. £ -=M. 


Mais 


Sph.t — %Ph —i, 


d’où co = i ; ce qui montre d’abord qu’il y a une racine égale 

à i. 

En ce qui concerne les autres racines, les équations (3) 
nous donneront 

(4) 'Z\Ph.iæ ll \t\<*x i \ 

ou, puisque tous les p sont réels et positifs. 


Ajoutons toutes ces inégalités; il viendra 
•Sj 2* Ph.i | OB h I ^ | M | 2 | Xi |. 


Mais 


'ZtPh.i= i. 


Donc 

d’où 

d’où 


^i — l hPh.i 1 æ h | — ^ I | j 


2 |« a | = [<0 \1\Xi\, 


I. 


Ainsi aucune racine ne peut être plus grande que i en 
valeur absolue. 

c. Q. F. D. 


229. Soit u une racine différente de i ; considérons un 
nombre complexe appartenant à cette racine u, c’est-à-dire, 
d’après la phraséologie adoptée par M. Gartan, un des 
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nombres X, X l5 ..., tels que 

PX = uX, PX 1 =aX 1 + s 1 X, 

je dis que, pour tous ces nombres complexes, 

hæi— o. 

En effet, remplaçons dans tous nos nombres complexes 
toutes les unités complexes e £ - par l’unité ordinaire; les 
égalités qui peuvent exister entre ces nombres complexes 
subsisteront. Si l’on a 

ces nombres complexes après la substitution deviendront 
respectivement 

—I) X 0!j{ , 

et nos égalités deviendront 

X« £ = <ùhxi, 

et par conséquent, si u n’est pas égal à 1 , 

2# £ = 0 , 2æj = o. 

230. Nous avons dit qu’il y a une racine égale à 1 ; il reste 
à savoir s’il ne peut pas y avoir plusieurs racines dont le 
module soit égal à 1 , ou encore si r n’est pas racine multiple. 
Pour que l’inégalité (4) se réduise à une égalité, il faut que 
tous les æ £ aient même module, et, comme ces æ £ ne sont 
déterminés que par leurs rapports, nous pouvons supposer 
qu’ils sont tous réels et positifs. Gomme les p sont tous réels 
et positifs, il en sera de même de u, c’est-à-dire que nous 
aurons 


M =1. 
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Soit alors xj le plus grand de tous les x c ; nous aurons 

^‘Ph.j æ h= ^‘Ph.j æ j =zæ Ji 

cette inégalité ne pouvant se réduire à une égalité que si 
tous les p h j sont nuis, sauf ceux qui multiplient un æ h égal 
à æ } . Mais l’équation (3) nous donne 

'Zph.j a>h =<ùxj= Xj. 

Nous devons donc conclure que 

P fi.j - o si X/ t <^xj^ 

ce qui nous montre déjà que, si aucun des p t et par con¬ 
séquent aucun des p k} - n’est nul, tous les x £ seront égaux. 

Nous dirons que la permutation S* appartient à la catégorie 
G, si x £ est égal à x J} c’est-à-dire au plus grand des a-. 

Je dirai d’autre part que la substitution S* appartient à 
l’ensemble E si, toutes les fois que S y - appartient à la caté¬ 
gorie G, il en est de même de 

S/ t = Sj 1 S/. 

La condition nécessaire pour que J p*= p hJ puisse ne pas 
être nul, c’est alors que S* appartienne à l’ensemble E. 

Je dis maintenant que l’ensemble E constitue un sous- 
groupe de G. Si en effet S* et S e appartiennent à cet 
ensemble, cela, veut dire que S j ne peut appartenir à C, 
sans qu’il en soit de ; même de S/— I Sy et de S e -1 S y -. Mais 
alors il devra en être de même de 

S* 1 (S^S/) = (S.S Jt )- I S /> 

ce qui veut dire que S e S* appartiendra aussi à G. 

Donc la circonstance qui nous occupe ne pourra se pré¬ 
senter que si tous les p k sont nuis, sauf ceux qui corres- 
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pondent aux permutations d’un certain sous-groupe, c’est- 
à-dire si l’on sait d’avance que le joueur en battant les cartes 
n’exécutera jamais que des permutations appartenant à ce 
sous-groupe. 

Si on laisse de côté ce cas d’exception unique, l’équation 
PX = X 

ne peut être satisfaite que si tous les æ t sont égaux entre 
eux. 


231. Une possibilité subsisterait encore ; on pourrait 
supposer qu’il existe un nombre complexe X t tel que 

(o) P X t = Xi -+- EjX, £i<0, 

X - e„ e j -+-... -t- e r 

et que la racine i est multiple. Mais de l’équation (i) on 
déduit 

P»X I = X,-»-nsiX. 


Les coefficients de Xi et de SiX ne dépendent pas de n; 
ceux de P re dépendent de n, mais ils restent réels et positifs, 
et leur somme demeure égale à i ; puisque P“ représente 
symboliquement la loi des probabilités après n coups. 

Les coefficients de P K X restent donc limités. Au contraire, 
ceux deXi-t-«£iX sont des polynômes du i er degré en n\ 
ils ne peuvent donc être limités; l’équation (5) est donc 
impossible. 

Si nous reprenons l’équation de la forme 
PX = mX, 

nous avons vu que u est donné par une équation d’ordre 
r + i; et qu’à une racine d’ordre de multiplicité n, appar- 
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tiennent p nombres complexes distincts. La somme des 
ordres de multiplicité étant r-t-r, il y aura r-t-i nombres 
complexes appartenant aux diverses racines, et ils seront 
linéairement indépendants. Un nombre complexe quelcon¬ 
que peut donc être considéré comme une combinaison 
linéaire de ceux qui appartiennent aux diverses racines. 

Dans le cas qui nous occupe, un seul nombre appartient 
à la racine i, c’est 

e 0 “t" e i “I- • • • ■+* 5 

tous les autres appartiennent à des racines <i en valeur 
absolue, et la somme des coefficients de chacun de ces 
nombres complexes est nulle. Il résulte de là que tout 
nombre complexe, tel que .la somme de ses coefficients soit 
nulle , peut être regardé comme une combinaison linéaire 
des nombres complexes qui appartiennent aux racines < i 
en valeur absolue . 

232. Considérons- maintenant une racine o> telle que 
| ta | <i; nous aurons, si cette racine est multiple, 

PX = oX, PXi=aX 1 -i-s 1 X, PX a =uX 2 -t-£ 2 X 1 , - .... 
et nous en dédnirons aisément 

P' 1 X = m“X, P*X I =M ,l X I -+-raM tt - 1 e l X, 

P«X,= (ü re X 2 -i- «a > »-*8i ! X 1 + ■ n( "~^ M—«e 1 g t X', 

Comme e» n , na> n — 1 , —— a n ~-, ... tendentvers zéro quand 

n croît indéfiniment, on voit que, pour un nombre complexe 
X quelconque appartenant à une racine <i en valenr 
absolue, on a 

limP B X = o (n — oo). 
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Mais tout nombre complexe est une combinaison de ceux 
qui appartiennent aux racines < r, pourvu que la somme de 
ses coefficients soit égale à zéro. 

On aura donc encore 

limP re X = o 

toutes les fois que la somme des coefficients de X sera 
nulle. 

Si au contraire X appartient à la racine r, c’est-à-dire si 
tous ses coefficients sont égaux entre eux, on aura 

P«X=X. 

Si X est un nombre complexe quelconque, nous pourrons 
poser 

X = SX„4-X', 

où S est la somme des coefficients de X, où 
X c = ———(e 0 -i- e,-t-.. . 4 -e r ) 

/ “T“ 1 

et où la somme des coefficients de X' est nulle. On aura 
alors 

limP re X = SX 0 . 

Remarquons maintenant que 

XoX = XX„=SX 0 . 

On aura en effet 

X = 2*„„ X.=2 7 ^ 7 . 

x - x =2ftt-« 

k 
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où l’on a posé x k j — xi en admettant ejei—e k ou biën 


k 

Mais les x k j qui figurent sous le signe 2 y - sont, dans un 
ordre différent, les x t eux-mêmes, c’est-à-dire que 

2 j x k.j —— 2®;= S, 

d’où finalement 

X 0 X = SX 0 
et 

lim(P re — X 0 )X =o. 

Mais X est un nombre complexe quelconque; nous pou¬ 
vons donc prendre X = e 0 , d’où 

(P«— X 0 )X=(P» — X 0 )e 0 =P"—X 0 . 

II reste donc 

limP K =Xo, 

ce qui veut dire qu’à la limite, toutes les probabilités, c’est- 
à-dire tous les coefficients du nombre complexe P" qui re¬ 
présente symboliquement la loi de probabilité, sont égaux. 
C’est ce que nous nous étions proposé de démontrer. 

Je renverrai à quelques-uns des ouvrages où il est traité 
des nombres complexes et de leurs rapports avec les groupes. 
Je citerai en première ligne les travaux de M. Frobenius 
publiés dans les Sitzungsberichte de l'Académie de Berlin 
de 1896 à 1901 , et ensuite un mémoire deM. Carlan Sur les 
groupes bilinéaires et les systèmes de nombres complexes 
{Annales de la Faculté de Toulouse, t. XII). Je me suis moi- 
même occupé de la question, et.je me suis en particulier 
efforcé de rapprocher les résultats présentés par ces deux 
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savants éminents sous des formes très différentes à l’occasion 
d’une étude Sur l’intégration algébrique des équations 
linéaires, insérée dans le Journal de Liouville, 5 e série, 
t. IX. 


233. Répartition des décimales dans une table numérique. 
— Supposons qu’on prenne dans une table de logarithmes 
un grand nombre de logarithmes consécutifs et que l’on 
considère la troisième décimale par exemple. On verra que les 
dix chiffres o, i, a, 3,..., 9 sont également répartis sur celte 
liste; et par conséquent la probabilité pour que celte troi¬ 
sième décimale soit paire est égale à - • Un instinct invin- 

« 2 

cible porte à le penser, et d’ailleurs on peut le vérifier a 
posteriori. Y-a-t-il moyen de rendre compte de ce fait? 
Envisageons les nombres 

logfn-— 

100000 / 

où nous donnerons à æ toutes les valeurs entières depuis 1 
jusqu’à ioopoo. Considérons la fonction 

f[Wh——Y l, 

L \ 100000 /j 

F (y) étant une fonction qui est égale à -+- 1 > si la troisième 
décimale dey est paire, et à— 1 , si cette décimale estimpaire. 
Je me propose de démontrer que la valeur moyenne de F (y) 
est nulle ou très petite. 

D’après la définition de F (y), on a 

F (^ + 5^) =F( ^’ 

ce qui montre que F (y) est une fonction périodique de 
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période il en est de même de 
sin(ioooiry), 

fonction que nous envisagerons d’abord. Nous devons donc 
évaluer la somme 

10 000 

S — — l —. sîn iooo7rlo£( h-——) • 

ioooo L \ rooooo / 


Remplaçons-la par l’intégrale. 


10000 4 *- 

J=- / sin ioooil log ( i -t--—■—| \dæ. 

ioooo J L \ 100000 /J 


Évaluons d’abord la différence S—J; nous nous appuie¬ 
rons sur la formule de Taylor 

A 2 

ip(n+/i) = (j)(n) + /iii'(n)+ — -^"(n -i-8fi) (o < 8 <Z i). 


! (o(æ)dæ—cf(n 


) + — 0'M. 
12 


où 6' est compris entre — i et-t-i, où M est le maximum 
de | e>" (æ) | dans l’intervalle considéré. Si nous prenons 


cp(æ) =sin j^i 


i -t—-) j 

. 100 000 / 


et que nous fassions n— r, 2 , ..., ioooo et que nous ajou¬ 
tions; il viendra 

J — S = —-—20'M. 

120000 
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Qa’est-ce que M? Posons pour abréger 

æ \ œ 


loooit log ( i 


100000 


= r; 


ioo ooo 


il viendra 


,, . i i 

® (æ) :=iooott -cos y, 

T v ' iooooo I-+-.3 J 

i 


<o n (x) — (ioo o,r )' (looooo ) ~ 3 (7T^ Siny 


— 10007T 


d’où 


d’où 


M < 


7r- 


(iooooo)- 


< 


cos y, 


(ioo) 2 (I00)*I000 1000 


■cmni _ 10 000 

29'M <-= io. 


I J —S|< 


1000 

I 


12000 

Évaluons maintenant la limite supérieure de J. 
x 


iooooo 


» «=ioootî, ?< = log(i-+-^ 


d’où 


J = io^" sinaii= io f sm oc ue a du. 


L’intégration par parties me donne 

cos œ« e n r Ul cos oc u 

-1- 1 - e u 

oc J oc 


10 


du. 


< 


Or 


e «, r Ul e li c 

oc ’J oc 

7 /. 


Ul e li du 2 e“i 

< 


e"or= 14 - 


200000 


„ ioooo 

e i = i H- =i,i. 

iooooo 


Posons 

), 
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Donc 


' 1 iooir ioo 


ou, en comparant avec la limite | J — S |, 
ISI < rrr* 


234. La démonstration a été donnée sur un exemple très 
particulier, mais il est aisé d r en apercevoir le véritable sens 
et par conséquent la portée générale. 

On s’est appuyé en réalité sur trois faits : 

i° Les dérivées successives du logarithme restent finies 
dans l’intervalle considéré; 

2 ° Le nombre a. = ioooir est très grand; 

3° Bien que grand d’une manière absolue, il est très petit 
par rapport au nombre îooooo qui figure au dénominateur 
dans l’expression 

x 

i -1— : - 

ioo ooo 

On voit que ces mêmes circonstances se reproduiront 
dans un grand nombre de cas analogues, et que les mêmes 
raisonnements seront applicables à toutes les fonctions 
continues. Soit plus généralement à évaluer la somme 

S = (3 2 F [« o ((3 x )], 




où a est un très grand nombre, F une fonction périodique 
limitée; S un nombre très petit et tel que «{3 soit lui-même 
très petit, et où l’on donne à x toutes les valeurs entières 
depuis r jusqu’à Nons comparerons cette somme à l’inté¬ 
grale 


J —J" F[« <p(æ)] ds. 
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Il viendra comme plus haut 

J-S = -£-20'M, 

12 

M étant le maximum de la dérivée seconde de F [«.<? ((3 æ:)] 
par rapport à a?; or cette dérivée seconde est égale à 

(«( 3 )^ 9 '*-!-«|3 S F' 9 ", 

les lettres accentuées désignant les dérivées de F et 9 par 
rapport à leurs arguments respectifs «9 et (3.z\ On voit que, 
si ces dérivées sont limitées, J — S est de l’ordre de («P )*. 

Soit maintenant $ (a) la fonction primitive de F («) de 
telle sorte que 

F(k) 

l’intégration par parties nous donnera 



ce qui montre que J est de l’ordre ^ • Il suffit donc, pour que 

notre raisonnement soit applicable, que ^ et (a(3 ) 2 soient 
très petits. 

235. Deux difficultés subsistent encore cependant.Le résul¬ 
tat n’est-t-il pas vrai alors même que «(3 n’est pas très petit, 

pourvu que (3 etle soient. Supposons qu’au lieu dérai¬ 
sonner sur la troisième décimale d’une table à 5 décimales, 
nous ayons raisonné sur la cinquième, au lieu de prendre 

OC = I 0007T, (3= - -—, 

100000 
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nous aurions dû prendre 

« = ioooooir, (3 =--— 3 

ioo ooo 

et.«(3 n’aurait plus été très petit. Et cependant l’instinct, qui 
nous pousse à croire que la troisième décimale doit être 
uniformément répartie, est aussi puissant en ce qui con¬ 
cerne la cinquième. 

En ce qui concerne l’évaluation de J, il ne peut y avoir 
de difficulté même si «(3 n’estpas très petit; on n’aurait donc 
à s’occuper que de la différence J — S. D’autre part, la fonc¬ 
tion périodique F que nous avions définie au début de cette 
étude et qui s’introduit quand on veut étudier la répartition 
des décimales dans une table de logarithmes, cette fonction 
à laquelle nous avions substitué un sinus pour faciliter le cal¬ 
cul, était égale à ± i suivant qu’un certain chiffre était pair 
ou impair. C’était donc une fonction discontinue, et nous ne 
pouvons nous appuyer, dans le calcul de J — S sur ce fait que 
ses dérivées sont limitées. 

On pourrait, il est vrai, développer cette fonction pério- 
diqueF en série de Fourier, et l’on seraitramené à des sinus 
auxquels on pourrait chercher à appliquer ce qui précède; 
mais pour les termes d’ordre élevé de cette.série, le nombre 
« serait très grand et le produit a (3 ne serait pas très petit; 
on retomberait donc sur la première difficulté. 

236. Force est donc de recourir à d’autres considérations. 
Soit F(æ) une fonction dont les dérivées sont limitées. For¬ 
mons unetableoùnous donnerons à æ toutes les valeurs mul¬ 
tiples de —--Est-il possible que dans cette table la cin- 

quième décimale soit toujours égale à o? On aurait alors 

v \ n 

- =-h e, 

10000 / 10000 
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où v et n sont des entiers et e<-- Nous nous appuie- 

100000 11 

rons sur la formule connue 

F{x -h 2 /i) -h F(x) — 2 F(a? -1- h) — hPF a (x -+- 2 8 h) 
(o<0<i). 

Donnons à x une valeur multiple de——-et taisons 

1 10000 

h = ~— 

10000 


Soient etS|, « 2 ets 2 , « 3 ete 3 les valeurs rien etecorres- 
pondant à x, x-+-h, x-{- 2 h; il viendra 


7,2 -p//_ w 3 —2 n,_ 

10000 


Sl-f- £ 3 — 2E 2 . 


Comme s est plus petit que T00 p 00 nous pourrons poser 


£(-(- £ 3 - 2S 2 - 


49 

IOO 000 


(«<*), 


«j-t- n 3 — 2 « 2 = N, 

d’où 

40\ 

H-) 10000 . 

10 ) 



Si F" qui est limité n’est pas de l’ordre de roooo, il faut 
que N = o; ou 


Tl\ - 4 - W3 -— 2 


c’est-à-dire que les entiers n, o'u encore les nombres qui 
figurent dans notre table, soient représentés par un poly¬ 
nôme du i cr degré; ou encore qne lès différences secondes 
de notre table soient toutes nulles. Cela n’est évidemment 
qu’un cas très particulier, et, pour la plupart des fonctions, 
on pourra affirmer que cela n’a pas Heu. 
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On voit par là, sans que j’insiste davantage, sur quelles 
bases on pourrait appuyer une théorie de la probabilité de 
la répartition des décimales dans une table numérique. 

237. Mélange des liquides. — Je ne dirai que quelques 
mots d’une autre question dont l’importance est très grande, 
mais que je ne suis pas en mesure de résoudre. Considérons 
un liquide enfermé dans un vase qu’il remplit entièrement. 
Les molécules de ce liquide sont en mouvement permanent; 
les lois de ce mouvement sont connues, et elles s’expriment 
par des équations différentielles que je considère comme 
données. Soient x, y, z les coordonnées d’une molécule; 
on aura pour les composantes de sa vitesse 

dx_ d r dZ— 7 

dt~~ ’ dt~ X ' dt~ 


Si le mouvement est permanent, X, Y, Z sont des fonc¬ 
tions des coordonnées x, y , s indépendantes du temps t, et 
je suppose que ces fonctions soient données. Le liquide 
étant incompressible, on aura la relation 

dX dY dZ__ 

dx dy dz °’ 


Si l’équation de la paroi du vase est 

?(«> y,*) = o, 


on aura en tous les points de cette paroi la relation 


xÿ-H-yÿ + zÿ: 

dx dy dz 


qui exprime que la composante normale de la vitesse ; est 
nulle. 



QUESTIONS DIVERSES. 


321 


Cela posé, j’imagine que certaines molécules du liquide 
se distinguent des autres par quelque qualité apparente, 
qu’elles soient de couleur rose par exemple, tandis que les 
autres sont incolores; mais qu’elles obéissent d’ailleurs à la 
même loi de mouvement. 

Au temps t — o, elles sont distribuées d’une manière 
quelconque dans le vase; l’expérience courante nous 
apprend qu’au bout d’un certain temps elles seront entiè¬ 
rement mélangées avec les autres; elles seront uniformé¬ 
ment répandues dans le vase. 

Considérons un volume v intérieur au vase; quelle est, à 
un instant quelconque, la quantité de liquide rose qui y est 
contenue, ou, si l’on aime mieux, quelle est la probabilité P 
pour qu’une molécule prise au hasard dans cette région 
soit rose ? Si la répartition est uniforme, cette probabilité 
sera une constante, quel que soit le volume p choisi à l’in¬ 
térieur du vase. 

Si l’on envisage deux volumes p 4 et p 2 pour lesquels cette 
probabilité soit P t et P„ et qu’on appelle P la probabilité 
relative au volume total p t -t- p 2 , on aura évidemment 

P ( fi t'a) = P t et P 2 P 2 , 


et nous pourrons écrire, pour un volume quelconque. 



où l’intégration est étendue à tous les éléments dx du 
volume p et où p est la probabilité relative au volume dx. 

Celte probabilité p est une fonction de æ, y, s, t définie 
par l’équation 
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Considérons alors deux volumes quelconques v et ç', et 
les probabilités correspondantes P et P';.peut-on admettre 
que, quelle que soit la distribution initiale du liquide, c’est- 

P' 

à-rdire la valeur de p pour t — o, le rapport -p- tendra vers i 

quand t croîtra indéfiniment, et cela d’autant plus vite que 
les deux volumes v et v' seront plus grands^ et d’une forme 
plus simple ? 

Si nous ne pouvons admettre cela, pouvons-nous admettre 
au moins que le rapport 



tend vers i quand T croît indéfiniment? 


238. Telle est la question qui se pose et qui n’est pas 
encore résolue; je voudrais expliquer en quelques mots ce 
qui en fait l’importance. Imaginons un système mécanique 
de situation définie par n coordonnées qi,q^ ..q a -, 
son mouvement satisfera aux équations de Hamilton, 

dq t dF dp t dF 

dt dpi dt dqt 


T est l’énergie cinétique, U l’énergie potentielle, 
F =T -+- U l’énergie totale,.et l’on a />i= ■ Considérons 

qi t q%, • ■ q n \Pu Pi> • • •> Pu comme les coordonnées d’un 


point dans l’espace à 2 n,dimensions. Écrivons les équations 

* * ’ ‘ ' 1 

de Hamilton sous la forme 


dqt _q e?F dpi_ p _ 

dt ~ ^ dpi’ dt 1 ■ dqt 
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Ges équations seront de même forme que celles du mou¬ 
vement de notre liquide, car elles satisferont à la condition 


v? <X±i 
Zi dqt 



dPç 

dpi 


o 


analogue à la condition d’incompressibilité. Nous avons 
donc, pour ainsi dire, à étudier le mouvement d’un liquide 
dans un vase à 2 n dimensions. Quelle que soit la probabi¬ 
lité de telle ou tellé situation du système à l’instant zéro, 
n’àllons-nous pas avoir une probabilité uniforme pour cette 
situation à l’instant t, pourvu que t soit assez grand? 

C’est là ce qu’on postule dans la théorie cinétique des 
gaz, et en particulier quand on veut établir le théorème de 
Boltzmann-Maxwell. Il y aurait donc un grand intérêt à 
justifier ce postulat. 


239. Le postulat doit être vrai en général; mais il est 
certain qu’il comporte des cas d’exception. Si les équations 
différentielles 

dx dy ds , 

T = T == T = dt 

comportent une intégrale 

F(æ:, y, z) = const., 

où F est une fonction uniforme, l’intégrale 

P Ç —J"P d?, 

étendue au volume limité par deux surfaces 

F(*,y, 3) = a, F (x,y,z) = b 

sera une constante; si alors nous envisageons deux sem- 
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blables volumes p et p', définis respectivement par les iné¬ 
galités 

a<F<6, «'<¥<6', 


et que nous appelions P et'P' les probabilités correspon- 
P' 

dantes, le rapport-p-sera une constante indépendante du 

temps, et, comme d’ailleurs la valeur initiale de cette cons¬ 
tante est arbitraire, il ne pourra tendre vers i. 

Voici comment, dans ce cas, doit être modifié notre pos¬ 
tulat. Considérons le volume Iimîlé par les deux surfaces 
infiniment voisines 


a < F < a da. 


Soient V (a) da ce volume, P (a) da l’intégrale j pdi cor¬ 
respondante. 

Considérons maintenant deux volumes quelconques 
p' et p". Soient P f et P* les deux probabilités correspon¬ 
dantes. Soient V'(a) da le volume commun à.V(a)da et à p 1 , 
et de même V l! (a)da le volume commun à V(a) daet p"; 
on aura pour t=œ 



JV' (a) da 
J' Y"(a)da 


En d’autres termes, dans chacune des couches infiniment 
minces, définies par les inégalités a<F <_a-+-da, la pro¬ 
babilité sera finalement répartie d’une manière uniforme, 
mais la « densité » de celte probabilité finale variera d’une 
de ces couches à l’autre. 

C’est précisément cette circonstance qui se présente dans 
le cas des équations de Hamilton qui admettent l’équation 
des forces vives F = const. 
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Mais ce n’est pas là la seule exception possible. Supposons 
que les équations n’admettent pas l’intégrale générale 
F = const., mais qu’elles admettent l’intégrale particulière 
F = o, c’est-à-dire que l’équation F = o entraîne la sui¬ 
vante, 

d¥ XT d\! „ dF 
X-7- +Y t + Zt- =0. 

dx d+> 

Alors la surface fermée F = o divisera le vase en deux 
régions; dans chacune de ces régions, la probabilité sera 
finalement répartie d’une manière uniforme, mais la den¬ 
sité de cette probabilité finale ne sera pas la même dans les 
deux régions. 


240. Autre cas d’exception. Pour bien le faire comprendre, 
je prends d’abord un exemple particulier. Je suppose d’abord 
qu’il y ait une intégrale F = const. et que la surface F=o soit 
un tore. Si le postulat était vrai, même avec la modification 
envisagée au numéro précédent, la probabilité finale devrait 
être uniformément répartie dans la couche infiniment 
mince comprise entre les deux surfaces F = o et F = s, où s 
est très petit. Pour représenter la position d’un point sur le 
tore F—o, nous nous servirons de deux angles; l’un 9 sera 
la longitude, l’autre w sera l’angle compté sur la section 
méridienne et qu’on pourrait appeler la latitude s’il ne 
variait de o° à 36o°, au lieu de varier de — 90 0 à - 4 - 90°. 
Soient alors 


dy 


dt 


= ®, 


dm 

dt 


= 0 , 


les équations différentielles du mouvement, et supposons 
d’abord que $ et soient des constantes. Nous pouvons 
supposer que la surface F = e a été choisie de telle sorte 
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que ces équations soient compatibles avec la condition d’in¬ 
compressibilité (cela revient à supposer que la distance 
normale des deux surfaces F = o et F = s est en raison 
inverse de la distance à l’axe de révolution). Nous aurons 
alors 

Ç .Zin Çq —£, (h &)q -J- Üty 

<p 0 et w 0 étant les valeurs initiales de o et de u; dans ces 
conditions la valeur probable de l’expression 

sin(7w<p-t- rew-t- h), 

où m et n sont des entiers et h une constante, sera 

J"p 0 sin(mcj) -i- «m + h) dy 0 dn 0 , 

où p 0 est une fonction donnée et d’ailleurs arbitraire de <p 0 
et de w 0 . Cela fait 

Àsin(m4> -t- B cos(»î< 6 -t- nQ)t, 


=f p -7A 7wo 0 -t- «&)„-(- fi'j do a da> 0 . 


II est manifeste que cette expression oscillera sans tendre 
vers aucune limite déterminée. Le premier postulat n’est 
doncpas vrai dans ce cas. Il n’en est pas demême du deuxième 

postulat qui se rapporte à l’intégrale I P dt. Nous avons 

J 0 

en effet à envisager l’expression 

jj; J dt^J'po&in^nuf -f-rew-t- h) dy 0 
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qui est égale à 


A. g 

Tjr J Bin(m® + «û)^i+ î J cos(m®-t-«£2)r <*. 


Cette expression tend vers zéro quand T grandit indéfi¬ 
niment, sauf dans le cas où m® + n£î èst nul. 
Orm®-+-7i£2peut s’annuler d’abord si ® et étant com- 

1 fît fl 

mensurables entre eux, le rapport — est égal à —Dans 

ce cas. la trajectoire décrite par une molécule liquide est 
une courbe fermée, ayant pour équation 

F = o, F t =const.; 


nous n’avons donc plus seulement une intégrale uniforme, 
mais nous en avons deux, et nous retombons sur le cas 
d’exception du numéro précédent. 

Le coefficient m® -+-»& peut encore s’annuler si ® et S 
sont incommensurables et si m et n sont nuis. Soit alors 0 
une fonction périodique quelconque de w et de o; envisar 
geons sa valeur probable 

Il p 0 &d(ù 0 do 0 

et l’intégrale 

n ( t) dt. 

0 


Nous pouvons développer 0 en série de Fourier. À chacun 
des termes de cette sérié correspondra un terme de J. 
D’après ce qui précède, lous ces termes de J tendront vers 
zéro pour T très grand, sauf le terme où m — n = o, c’est- 
à-dire celui qui correspond à la valeur moyenne de 0, au 
terme constant de la série de Fourier. 

Un raisonnement tout pareil à celui du paragraphe 239 
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nous montrerait que cela signifie que la probabilité repré¬ 


sentée par l’intégrale J"$dt est uniformément répartie. 


241. Il est essentiel de se rendre compte des véritables 
raisons de la nouvelle exception que nous venons de 
signaler. Considérons une des molécules de notre liquide 
qui occupera au temps o le point y 0 , z 0 et au temps t le 
point æ, y, s; considérons ensuite les molécules qui au 
temps o remplissent une sphère de rayon s ayant pour 
centre le point æ 0 , y 0 , z 0 ; au temps t elles rempliront un 
volume très petit; ce volume, si s est infiniment petit, sera 
assimilable à un ellipsoïde ayant pour centre le point 
æ, y, s. 

Comment se comportera cet ellipsoïde quand on fera 
varier tl En général, ses axes deviendront de plus en plus 
inégaux, de telle sorte que le rapport de ces axes tende vers 
l’infini. Cela est essentiel pour que le postulat soit vrai; 
dans le cas d’exception signalé, il n’en est pas ainsi; si nous 
appelons y 0 , z 0 les coordonnées initiales d’une molécule, 
et que nous décrivions, du point æ 0) y 0 , s 0 comme centre, 
une sphère de rayon e, cette sphère découpera sur la sur¬ 
face du tore une aire qu’on pourra assimiler à un cercle de 
rayon très petit. Quand t croîtra, cette aire va se déplacer 
sur la surface du tore en restant assimilable à une petite 
ellipse; mais Faplatissemeüit de cette ellipse, au lieu de 
croître sans limite, va osciller entre certaines limites, ainsi 
qu’il est aisé de s’en rendre compte. Si nous considérions 
pour un instant w et <p comme les coordonnées d'un point 
dans un plan, nous aurions une représentation de la surface 
de notre tore sur un plan; notre petite ellipse serait alors 
représentée sur le plan par une autre petite ellipse qui 
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resterait toujours égale à elle-même; si donc nous revenons 
à l’ellipse infiniment petite tracée sur le tore, le rapport de 
ses axes ne dépendra que du rayon du parallèle du tore 
sur lequel se trouve son centre, en d’autres termes ce sera 
une fonction linéaire de cos «; ce sera donc une fonction 
périodique du temps. 


242. Voyons maintenant un exemple où cette exception 
ne se présente pas, mais en nous bornant toujours à un cas 
particulier. Reprenons notre tore F = o, et nos équations 


de; 

dt 


= ®, 



mais sans que 4> et £2 soient des constantes; nous pourrons 
toujours disposer de la surface F =e de façou à satisfaire à 
la condition d’incompressibilité. Supposons 

<D = ctM, £2 = (3 M, 


où a. et (3 sont deux constantes dont le rapport est incom¬ 
mensurable et M une fonction périodique de <p et de « qui 
ne peut ni s’annuler, ni devenir infinie. 

Nous pourrons introduire une fonction auxiliaire t telle 


que 


d’où 



? = «+ <P0t 


d<ù „ 



G) — (3t -t- Mo, 


f 



~ est une fonction de t, et de plus une fonction périodique 
M 

de m 0 et de ip 0 . Considérée comme fonction de t, elle est 
développable en série trigonomélrique de la forme 


.2Àcos(yr-t- h) 
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où les coefficients ne sont pas entiers; c’est ce que 
M. Esclangon appelle une. fonction quasi-périodique; on 
tirera de là 

t = A 0 t m 0 , <po)> 

/étant une fonction quasi-périodique, et ensuite (dans cer¬ 
tains cas) 

t 

T — t~ -+*/i(£> «0, 9o)j 
A-0 

f étant une fonction quasi-périodique de t. Si À 0 dépendait 
de m 0 et de @ 0 , l’analyse pourrait se faire sans difficulté; 
mais il n’en est rien. A„ qui est le terme indépendant de t, 

c’est-à-dire de m et de 9 dans le développement de 

ne dépend ni de m„, ni de <jj 0 « 

Considérons la différence 

/i(«, Mo-t-S, ipo-t-*))— «0, 9o), 

où s et y] sont très petits; c’est encore une fonction quasi- 
périodique; si cette fonction reste limitée quand t varie de 
— oo à -f- oo, nous retrouverons des- résultats analogues à 
ceux du numéro précédent, et le postulat ne sera pas vrai. 
Si au contraire cette fonction quasi-périodique peut croître 
au delà de toute limite (et j’ai montré dans le Bulletin 
astronomique , Tome I, qu’il y a des fonctions quasi-pério¬ 
diques pour lesquelles cela arrive) le postulat est proba¬ 
blement vrai, mais nous rencontrerions pour l’établir toutes 
les difficultés qui s’attachent à la théorie des fonctions 
quasi-périodiques. 

Il en serait encore de même si nous supposions, d’une 
façon plus générale, 

*1* : oc -t— £®j, £2 — (3 -l— s£2i, 
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« et j3 étant des constantes, s une constante très petite, 
$ et des fonctions périodiques de cp et de m. On pourrait 
alors intégrer par approximations successives en dévelop¬ 
pant suivant les puissances de e, et l’on trouverait 

? = at-\-f ( t , m 0 , ipo)> 

C ù — , M 0 , Oo). 


a et b étant des constantes, / et f x des fonctions pério¬ 
diques par rapport à m 0 et à cpu et quasi-périodiques par 
rapport à t. Seulement, ici encore, a et b ne dépendraient 
pas de M 0 et <p 0 , de sorte que nous retrouverions les mêmes 
difficultés. 

243. Les difficultés que nous avons rencontrées dans ce 
cas si simple montrent celles qui nous attendraient dans 
le cas général. Disons quelques mots seulement d’un mode 
de raisonnement par à peu près auquel on pourrait être 
tenté d’avoir recours. Divisons le volume du vase en 
un nombre très grand n de volumes égaux; soient 
f> 2 , ces volumes; soit p t la probabilité pour 

qu’une molécule se trouve dans Je volume p soient 

•2?i, a?2, - • ■, 

n variables auxiliaires et considérons l’expression 
P =p l OC l -\-pzX,-\-. . .-‘s-pnX^. 

Soit q tk la probabilité pour que la molécule se trouve 
à l’instant t-t-r dans le volume f e en admettant qu’on 
sache qu’elle se trouvait à l’instant t dans le volume p*. Si 
alors la loi de probabilité, à l’instant t, est représentée par 
l’expression P, elle sera représentée, à l’instant t-t-r, par 
l’expression PS, qui représente ce que devient P quand on 
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lui fait subir la transformation linéaire S, c’est-à-dire quand 
on y change x k en 


• .~t ~ Çn.k æ n‘ 


A l’instant t- 1 - 2 T elle sera représentée par PS 2 , et à 
l’instant t -t- ht par PS A . Il serait aisé de démontrer que, 
quand h croît indéfiniment, la loi de probabilité représentée 
par PS A tend vers une loi de probabilité uniforme. 

Mais ce raisonnement prête à une objection grave. Il 
n’est pas démontré que la probabilité pour qu’une molécule 
soit à l’instant t-t- 2 rdans le volume v t en admettant qu’on 
sache qu’elle était à l’instant i-f-r dans le volume v k reste 
la même si l’on ne sait pas du tout où elle était à l’instant t, 
ou bien si l’on sait qu’elle était à cet instant dans le volume 

par exemple. 

J’ai cru devoir le citer néanmoins parce que c’est sur ce 
type que sont construits beaucoup de raisonnements dans 
la théorie cinétique des gaz, et que dans certains cas ils 
peuvent devenir plausibles; ainsi, quand on envisage la 
probabilité pour qu’une molécule gazeuse subisse une 
déviation donnée par un choc avec une autre molécule, 
celte probabilité ne sera guère affectée par les chocs anté¬ 
rieurs subis par la même molécule. 

Une grande partie des difficultés disparaîtrait si l’on 
supposait que les fonctions X, Y, Z ne sont pas entièrement 
données, mais qu’elles dépendent d’une fonction de t (ou 
même de plusieurs fonctions) dont la valeur est inconnue, 
et où l’on ne connaîtrait seulement que la probabilité pour 
que cette fonction ait une valeur comprise entre des' limites 
données, a et a-\-da, par exemple. On pourrait alors rai¬ 
sonner à peu près comme nous l’avons fait à propos du 
battage des cartes. 
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Prenons un exemple dans la théorie cinétique des gaz. 
Supposons des molécules gazeuses enfermées dans un vase 
en forme de parallélépipède rectangle, pouvant choquer 
les parois, mais ne pouvant se choquer entre elles. Si elles 
ont toutes la même vitesse, elles ne seront pas uniformément 
réparties dans le vase au bout d’un temps quelconque, si 
elles ne le sont pas au temps t = o. Elles le seront, au con¬ 
traire, si leur vitesse varie suivant une loi de probabilité 
quelconque, suivant la loi de Maxwell, par exemple, et 
cela quelle que soit cette loi. 
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